Как стать автором
Обновить

Комментарии 33

Уже было подумал, что речь идёт о чём-то заметно более странном, например, записях «белого шума с телевизора»
Можно записать и выложить на ютуб. А через несколько лет проснуться знаменитым:)

Скорее узнать, что вами были нарушены чьи-то авторские права.

Ну так в случае с белым шумом одно другому не помешает, а наоборот поможет:))
Интересная тема. На Astronaut.io у меня сплошные корейцы и японцы, наверное они больше всех загружают роликов. Вообще, похоже на github.com/ValdikSS/endless-sosuch, но последний более жёсткий треш выдаёт.
интересно, если ю-туб разорится и начнёт распродавать имущество, на сколько упадут цены на б/у дисковые хранилища?
Почему на серверах Google никогда не закончится место
image

Не так. Как говорит Гугл, место у вашего диска постоянно увеличивается, значит жёсткие диски должны быть в форме фермы-ранчо, где они растут из земли.

Как мусор найти так все мастера, а слабо написать программу по поиску редких данных?
Например музыка, фильмы. Все бьются над этим и только человек это может.
Человека в поиске данных ещё ни разу не смог заменить компьютер!
Пойду скажу своему кластеру с Elastic, что он не может заменить человека при поиске в тех сотнях гигабайт данных, которые он индексировал
сотни гигабайт? Может сотнях Петабайт? Сотни гигабайт — это у меня на домашнем ноутбуке.
Если гигабайт, то странно, что он их индексирует))) зачем? Вручную не найти или что там?)))

Ну например, мне надо найти вот эту песню:
RDGLDGRN — Lootin In London (explicit version)
в формате без потерь естественно. Где и как я могу это сделать?
И 200 треков ещё таких надо.
Как человек я его прямо сейчас в интернете возьму и найду и скачаю 100% бесплатно, а программе? Слабо?
Настолько толсто, что даже тонко.
ощущение, что отвечают тут роботы, а не люди.
Настолько толсто, что даже тонко.

Что толсто? Что тонко? Я задал прямой вопрос. Никаких толсто и тонко тут нет!
Есть большие проблемы с софтом поиска данных. И раньше были и сейчас есть и ни разу ещё никто не исправлял их. Зато мусор регулярно ищут в сети.
Мне кажется, что он даже не понимает, в чём дело…
Что такое редкие данные?
Ну вот в фильме я видел картину на стене, она показалсь интересной, я загрузил скриншот в гугл поиск — он мне вывалил куча других картин с похожей цветовой гаммой.
Вот эта картина на стене — редкие данные, потому что я может быть вообще единственный кто её искал. А поисковик вываливает самое популярное, ведь наверняка я ищу что-то что хотят и другие, а не уникальную вещь. И поисковик часто прав, но когда он не прав — найти что-то это боль.

Что за картина-то, из какого фильма?

Гуглопоиск сейчас мне выдает один живой результат
www.taringa.net/+arte/barry-gross-el-arte-de-la-soledad_gimvd
Где искомое примерно 40-я картинка.

tineye также позволяет предположить, что картинка понравилась не только вам
Похоже на то.
А мне не выдал ни одного подходящего.
Спасибо, кстати.
Пробовали Яндекс Картинки? От результатов поиска иногда становится не по себе, настолько похожие и редкие изображения находит.
Спасибо, попробовал! Как минимум нашел, что это скриншот из фильма!
Если картина не попала ни в какие каталоги, то в интернете ее не найти.
Особенно пока у каждого художника не было своего сайта.
Информация, увы, теряется.
информация не теряется! А не находится! Это большая разница. Не путайте.
У компании Google раньше (лет 5-10 назад) был хороший поиск… сейчас там не найти ничего. И дело не в том, что контента меньше стало, а в том, что очень много вырезается из найденного и много чего не кешируется и способы поиска не усложняются, а упрощаются. Скоро придётся платить не только за выход в интернет, но и за открытие сайтов. А поисковик будет совсем VIP сервисом для избранных. И все сайты в поисковике будут открываться за деньги :-)
По некоторым оценкам, гугл индексировал 0.2-4% интернета в 2014 году.
Не знаю, как изменяется эта цифра со временем, но держать малоиспользуемый индекс определенно дорого.
К тому же, поиск по картинкам весьма не идеален, а лет 5-10 назад его вообще не было :)
Это:
Экономически не выгодно

выливается в живём в грязи и нищете все. Независимо от материального состояния. Огребаем все дружно.
Это тратить ресурсы на то, чем вы будете пользоваться.
Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.
Поддержите каких-нибудь DuckDuckGo чтобы они сделали то что вам нужно, если есть желание.
Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.

Вот это «возможность» — то о чём я написал в первом посте. Это не программа или система — это человек. И нужно работать в сторону автоматизации человека в программу. Над этим сейчас никто не работает. Например у Google наблюдается обратное развитие и этот поиск находит всё меньше результатов.

И не придумывайте. У нас есть ещё одно «Экономически не выгодно». Исполнителям не всегда хватает денег на студийную запись. Так что до сих пор в 2019 году выпускаются mp3 в качестве релиза.

Бедность у нас не в кармане уже, а в крови и мы её просто не замечаем.
В любой сфере, где продуцирование обгоняет утилизацию происходит образование помойки. Околоземная орбита ли, города, интернет, планета целиком. Всюду, где человек вмешался, мы видим некий культурный слой, разгребать который не выгодно или попросту невозможно. Я не даю этому оценку, лишь фиксирую наблюдение.

Проценты от чего? Страницы, сайты?

Что-нибудь вроде «в среднем меньше одного поискового запроса в пятьсот лет» (но это не точно).
Раз столько еще не прошло, потенциальную популярность данных, которые никто никогда еще не искал, приходится угадывать.

Беглый поиск показывает, что люди интересуются только тем, как добавить свой сайт в выдачу, поэтому все статьи и официальный хелп только об этом.
Что происходит с данными без хозяина и коммерческой востребованности — никому не интересно.
Пробовал специально смотреть видео с минимумом просмотров. В основном скучная хрень: чьи-то прогулки в парке, снятые на камеру без стабилизации, какие-то латиноамериканские вечеринки с ужасным качеством, личные видео с каких-то мероприятий типа выпускного или с пятничного вечера на работе, и прочая лютая хрень. Как правило снятая очень криво и некачественно.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий