Комментарии 33
Уже было подумал, что речь идёт о чём-то заметно более странном, например, записях «белого шума с телевизора»
Интересная тема. На Astronaut.io у меня сплошные корейцы и японцы, наверное они больше всех загружают роликов. Вообще, похоже на github.com/ValdikSS/endless-sosuch, но последний более жёсткий треш выдаёт.
интересно, если ю-туб разорится и начнёт распродавать имущество, на сколько упадут цены на б/у дисковые хранилища?
Упс, промахнулся.
Как мусор найти так все мастера, а слабо написать программу по поиску редких данных?
Например музыка, фильмы. Все бьются над этим и только человек это может.
Человека в поиске данных ещё ни разу не смог заменить компьютер!
Например музыка, фильмы. Все бьются над этим и только человек это может.
Человека в поиске данных ещё ни разу не смог заменить компьютер!
Пойду скажу своему кластеру с Elastic, что он не может заменить человека при поиске в тех сотнях гигабайт данных, которые он индексировал
сотни гигабайт? Может сотнях Петабайт? Сотни гигабайт — это у меня на домашнем ноутбуке.
Если гигабайт, то странно, что он их индексирует))) зачем? Вручную не найти или что там?)))
Ну например, мне надо найти вот эту песню:
RDGLDGRN — Lootin In London (explicit version)
в формате без потерь естественно. Где и как я могу это сделать?
И 200 треков ещё таких надо.
Как человек я его прямо сейчас в интернете возьму и найду и скачаю 100% бесплатно, а программе? Слабо?
Если гигабайт, то странно, что он их индексирует))) зачем? Вручную не найти или что там?)))
Ну например, мне надо найти вот эту песню:
RDGLDGRN — Lootin In London (explicit version)
в формате без потерь естественно. Где и как я могу это сделать?
И 200 треков ещё таких надо.
Как человек я его прямо сейчас в интернете возьму и найду и скачаю 100% бесплатно, а программе? Слабо?
Настолько толсто, что даже тонко.
ощущение, что отвечают тут роботы, а не люди.
Что толсто? Что тонко? Я задал прямой вопрос. Никаких толсто и тонко тут нет!
Есть большие проблемы с софтом поиска данных. И раньше были и сейчас есть и ни разу ещё никто не исправлял их. Зато мусор регулярно ищут в сети.
Настолько толсто, что даже тонко.
Что толсто? Что тонко? Я задал прямой вопрос. Никаких толсто и тонко тут нет!
Есть большие проблемы с софтом поиска данных. И раньше были и сейчас есть и ни разу ещё никто не исправлял их. Зато мусор регулярно ищут в сети.
Мне кажется, что он даже не понимает, в чём дело…
Что такое редкие данные?
Ну вот в фильме я видел картину на стене, она показалсь интересной, я загрузил скриншот в гугл поиск — он мне вывалил куча других картин с похожей цветовой гаммой.
Вот эта картина на стене — редкие данные, потому что я может быть вообще единственный кто её искал. А поисковик вываливает самое популярное, ведь наверняка я ищу что-то что хотят и другие, а не уникальную вещь. И поисковик часто прав, но когда он не прав — найти что-то это боль.
Вот эта картина на стене — редкие данные, потому что я может быть вообще единственный кто её искал. А поисковик вываливает самое популярное, ведь наверняка я ищу что-то что хотят и другие, а не уникальную вещь. И поисковик часто прав, но когда он не прав — найти что-то это боль.
Что за картина-то, из какого фильма?
18+
Lionheart, 1992
Гуглопоиск сейчас мне выдает один живой результат
www.taringa.net/+arte/barry-gross-el-arte-de-la-soledad_gimvd
Где искомое примерно 40-я картинка.
tineye также позволяет предположить, что картинка понравилась не только вам
www.taringa.net/+arte/barry-gross-el-arte-de-la-soledad_gimvd
Где искомое примерно 40-я картинка.
tineye также позволяет предположить, что картинка понравилась не только вам
Пробовали Яндекс Картинки? От результатов поиска иногда становится не по себе, настолько похожие и редкие изображения находит.
Если картина не попала ни в какие каталоги, то в интернете ее не найти.
Особенно пока у каждого художника не было своего сайта.
Информация, увы, теряется.
Особенно пока у каждого художника не было своего сайта.
Информация, увы, теряется.
информация не теряется! А не находится! Это большая разница. Не путайте.
У компании Google раньше (лет 5-10 назад) был хороший поиск… сейчас там не найти ничего. И дело не в том, что контента меньше стало, а в том, что очень много вырезается из найденного и много чего не кешируется и способы поиска не усложняются, а упрощаются. Скоро придётся платить не только за выход в интернет, но и за открытие сайтов. А поисковик будет совсем VIP сервисом для избранных. И все сайты в поисковике будут открываться за деньги :-)
У компании Google раньше (лет 5-10 назад) был хороший поиск… сейчас там не найти ничего. И дело не в том, что контента меньше стало, а в том, что очень много вырезается из найденного и много чего не кешируется и способы поиска не усложняются, а упрощаются. Скоро придётся платить не только за выход в интернет, но и за открытие сайтов. А поисковик будет совсем VIP сервисом для избранных. И все сайты в поисковике будут открываться за деньги :-)
По некоторым оценкам, гугл индексировал 0.2-4% интернета в 2014 году.
Не знаю, как изменяется эта цифра со временем, но держать малоиспользуемый индекс определенно дорого.
К тому же, поиск по картинкам весьма не идеален, а лет 5-10 назад его вообще не было :)
Не знаю, как изменяется эта цифра со временем, но держать малоиспользуемый индекс определенно дорого.
К тому же, поиск по картинкам весьма не идеален, а лет 5-10 назад его вообще не было :)
Это:
выливается в живём в грязи и нищете все. Независимо от материального состояния. Огребаем все дружно.
Экономически не выгодно
выливается в живём в грязи и нищете все. Независимо от материального состояния. Огребаем все дружно.
Это тратить ресурсы на то, чем вы будете пользоваться.
Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.
Поддержите каких-нибудь DuckDuckGo чтобы они сделали то что вам нужно, если есть желание.
Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.
Поддержите каких-нибудь DuckDuckGo чтобы они сделали то что вам нужно, если есть желание.
Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.
Вот это «возможность» — то о чём я написал в первом посте. Это не программа или система — это человек. И нужно работать в сторону автоматизации человека в программу. Над этим сейчас никто не работает. Например у Google наблюдается обратное развитие и этот поиск находит всё меньше результатов.
И не придумывайте. У нас есть ещё одно «Экономически не выгодно». Исполнителям не всегда хватает денег на студийную запись. Так что до сих пор в 2019 году выпускаются mp3 в качестве релиза.
Бедность у нас не в кармане уже, а в крови и мы её просто не замечаем.
В любой сфере, где продуцирование обгоняет утилизацию происходит образование помойки. Околоземная орбита ли, города, интернет, планета целиком. Всюду, где человек вмешался, мы видим некий культурный слой, разгребать который не выгодно или попросту невозможно. Я не даю этому оценку, лишь фиксирую наблюдение.
Проценты от чего? Страницы, сайты?
Что-нибудь вроде «в среднем меньше одного поискового запроса в пятьсот лет» (но это не точно).
Раз столько еще не прошло, потенциальную популярность данных, которые никто никогда еще не искал, приходится угадывать.
Беглый поиск показывает, что люди интересуются только тем, как добавить свой сайт в выдачу, поэтому все статьи и официальный хелп только об этом.
Что происходит с данными без хозяина и коммерческой востребованности — никому не интересно.
Раз столько еще не прошло, потенциальную популярность данных, которые никто никогда еще не искал, приходится угадывать.
Беглый поиск показывает, что люди интересуются только тем, как добавить свой сайт в выдачу, поэтому все статьи и официальный хелп только об этом.
Что происходит с данными без хозяина и коммерческой востребованности — никому не интересно.
Пробовал специально смотреть видео с минимумом просмотров. В основном скучная хрень: чьи-то прогулки в парке, снятые на камеру без стабилизации, какие-то латиноамериканские вечеринки с ужасным качеством, личные видео с каких-то мероприятий типа выпускного или с пятничного вечера на работе, и прочая лютая хрень. Как правило снятая очень криво и некачественно.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Прислушиваясь к информационному шуму: музыка и видео, которые никто не должен был найти