Прислушиваясь к информационному шуму: музыка и видео, которые никто не должен был найти

    В популярном сериале «Рик и Морти» есть повторяющийся элемент — «Межпространственное ТВ». Это — специальная приставка к телевизору, с помощью которой герои получают доступ к всевозможным телевизионным каналам во всех параллельных вселенных. В нашей — этот прибор, к сожалению, не существует, но интернет позволяет нам наблюдать нечто очень похожее.

    Если проанализировать «информационный шум», можно увидеть наш мир с новой точки зрения. И (скорее всего) он вам покажется незнакомым, непредсказуемым и даже немного инопланетным.

    Расскажем, как все это осуществить.


    Фото Bruce Warrington / Unsplash

    Никому не нужные видео


    Каждую минуту пользователи YouTube загружают более 500 часов видеоконтента, поэтому алгоритмы рекомендательной системы сервиса нацелены на то, чтобы показывать зрителю только то, что ему должно понравиться. Из-за этого можно наблюдать ситуацию, когда у трети всех видео на сайте оказывается меньше десяти просмотров. Это — огромный архив роликов, которые были записаны без претензий на профессиональность, преимущественно для себя или родственников. Это — жизнь обычных людей без цветовой коррекции и монтажа.

    Но самое интересное здесь то, что для просмотра таких видео есть специальные сервисы, которые позволяют стримить ролики с малым количеством просмотров.

    Astronaut.io [GitHub]. Это веб-приложение анализирует свежие загрузки, заголовки которых имеют стандартные названия, заданные смартфоном или камерой. Обычно они начинаются с IMG или DSC и заканчиваются порядковым номером файла. Логично предположить, что видео, название которых владелец не удосужился поменять, не предназначались для широкой аудитории и не будут пользоваться популярностью у миллионов зрителей YouTube. Попробовать себя в роли исследователя таких роликов достаточно легко — требуется только нажатие на кнопку «GO». Далее — каждые несколько секунд плеер будет автоматически переключаться с одного клипа на другой.

    Стоит отметить, что у сервиса существуют альтернативы. Французский сайт PetitTube, работающий по другому алгоритму, не ограничивается новыми видео со стандартными названиями. На нем можно увидеть никому не нужную рекламу, видеозаписи МРТ и другой странный контент. Может показаться странным, но такие ролики (как явление) имеют преданную аудиторию. Маленькое, но живое сообщество IMGXXXX на Reddit посвящено поиску и обсуждению такого контента.


    Реддит-сообщество DeepIntoYouTube — еще один источник похожих роликов, но здесь редко появляются видео, которые можно найти на «Астронавте». Вместо этого, фокус сабреддита — на любительском контенте, который по тем или иным причинам «не выстрелил». Там можно найти ролики, в которых человек в маске Шрека записывает тематический ASMR, еще есть большое количество абсурдных комедийных роликов и не обходится без странных пользовательских влогов.

    Ctrl+Shift+Face. Еще несколько лет назад контент, который здесь публикуют, был бы невозможным — но и сейчас он воспринимается как нечто странное. Это — deepfake-видео, в котором лица комиков, актеров и других знаменитых людей заменяют на лица других. Конечно, такой контент оказывается гораздо популярнее нелепых роликов. На канале можно увидеть что-то вроде «альтернативной реальности», в которой главную роль в «Сиянии» Кубрика получил Джим Керри, а в «Богемской Рапсодии» снялся лично Фредди Меркьюри.


    Может показаться странным, но это YouTube-видео содержит в себе собственный URL. Как такое возможно? Если верить создателю видео, ответ один — его загрузили из будущего.

    Но на практике существуют способы, благодаря которым можно «зарезервировать» ID для своего ролика еще до начала загрузки. Но даже несмотря на объяснение, эта веб-аномалия кажется чем-то сверхъестественным. Похожие манипуляции можно произвести с твиттером — и создать рекурсивный твит, содержащий собственный адрес. Алгоритм, который позволяет предсказать адрес до загрузки контента, впервые опубликовали еще в 2009 году. Стоит отметить и эксперимент с гиф-анимацией, которая содержит собственный хэш.

    Музыка, которую никто не слушает


    Сервис Forgotify напоминает вышеупомянутый PetitTube, но вместо видео на YouTube он находит песни на Spotify, которые практически никто не слушал. Это — пятая часть от всего загруженного на площадку: от забытых исполнителей 60-х до рэперов, которым «не дано», или просто треков, о которых скорее всего забыли даже те, кто принимал непосредственное участие в их записи.


    Фото Lex Aliviado / Unsplash

    Вернемся к тому, с чего мы начали. В информационном шуме, который нас окружает в соц.сетях и глобальных видеосервисах, мы ориентируемся при помощи алгоритмов. Они ограждают нас от подавляющего большинства контента, который — по их оценке — нельзя назвать «качественным».

    Но выясняется, что вокруг даже самых редких и бесполезных вещей вроде отображения непопулярных результатов поисковой выдачи формируются тематические сообщества и даже специальные сервисы вроде тех, о которых мы рассказали вам выше. Если вы хотели бы поделиться своими находками по теме, будем рады их увидеть и обсудить в комментариях к этому материалу.



    Что еще почитать в нашем блоге:

    Как треск костра, скрип дверей и обыкновенный шум становятся электроакустическими треками
    «За нами следят»: что может происходить в неприметном минивэне прямо у вас под окном
    «Находки аудиомана»: карты звуков как способ погрузиться в атмосферу незнакомого города
    Феномен АСМР-аудио: мурашки и приятные покалывания
    Что такое музыкальное программирование — кто и почему им занимается
    «Гул Земли»: теории заговора и возможные объяснения
    «Массаж для твоего мозга»: поговорим об ASMR


    Аудиомания
    204.05
    Одна из крупнейших Hi-Fi, High End компаний в СНГ
    Share post

    Comments 33

      +4
      Уже было подумал, что речь идёт о чём-то заметно более странном, например, записях «белого шума с телевизора»
        0
        Можно записать и выложить на ютуб. А через несколько лет проснуться знаменитым:)
          +33

          Скорее узнать, что вами были нарушены чьи-то авторские права.

            +1
            Ну так в случае с белым шумом одно другому не помешает, а наоборот поможет:))
        +1
        Интересная тема. На Astronaut.io у меня сплошные корейцы и японцы, наверное они больше всех загружают роликов. Вообще, похоже на github.com/ValdikSS/endless-sosuch, но последний более жёсткий треш выдаёт.
          +3
          интересно, если ю-туб разорится и начнёт распродавать имущество, на сколько упадут цены на б/у дисковые хранилища?
            +2
            Почему на серверах Google никогда не закончится место
            image
              0

              Не так. Как говорит Гугл, место у вашего диска постоянно увеличивается, значит жёсткие диски должны быть в форме фермы-ранчо, где они растут из земли.

            0
            Упс, промахнулся.
              0
              Как мусор найти так все мастера, а слабо написать программу по поиску редких данных?
              Например музыка, фильмы. Все бьются над этим и только человек это может.
              Человека в поиске данных ещё ни разу не смог заменить компьютер!
                +2
                Пойду скажу своему кластеру с Elastic, что он не может заменить человека при поиске в тех сотнях гигабайт данных, которые он индексировал
                  0
                  сотни гигабайт? Может сотнях Петабайт? Сотни гигабайт — это у меня на домашнем ноутбуке.
                  Если гигабайт, то странно, что он их индексирует))) зачем? Вручную не найти или что там?)))

                  Ну например, мне надо найти вот эту песню:
                  RDGLDGRN — Lootin In London (explicit version)
                  в формате без потерь естественно. Где и как я могу это сделать?
                  И 200 треков ещё таких надо.
                  Как человек я его прямо сейчас в интернете возьму и найду и скачаю 100% бесплатно, а программе? Слабо?
                    +3
                    Настолько толсто, что даже тонко.
                      +1
                      ощущение, что отвечают тут роботы, а не люди.
                      Настолько толсто, что даже тонко.

                      Что толсто? Что тонко? Я задал прямой вопрос. Никаких толсто и тонко тут нет!
                      Есть большие проблемы с софтом поиска данных. И раньше были и сейчас есть и ни разу ещё никто не исправлял их. Зато мусор регулярно ищут в сети.
                        +1
                        Мне кажется, что он даже не понимает, в чём дело…
                    +1
                    Что такое редкие данные?
                      +5
                      Ну вот в фильме я видел картину на стене, она показалсь интересной, я загрузил скриншот в гугл поиск — он мне вывалил куча других картин с похожей цветовой гаммой.
                      Вот эта картина на стене — редкие данные, потому что я может быть вообще единственный кто её искал. А поисковик вываливает самое популярное, ведь наверняка я ищу что-то что хотят и другие, а не уникальную вещь. И поисковик часто прав, но когда он не прав — найти что-то это боль.
                        0

                        Что за картина-то, из какого фильма?

                          0
                          18+


                          Lionheart, 1992
                            0
                            Гуглопоиск сейчас мне выдает один живой результат
                            www.taringa.net/+arte/barry-gross-el-arte-de-la-soledad_gimvd
                            Где искомое примерно 40-я картинка.

                            tineye также позволяет предположить, что картинка понравилась не только вам
                              0
                              Похоже на то.
                              А мне не выдал ни одного подходящего.
                              Спасибо, кстати.
                          0
                          Пробовали Яндекс Картинки? От результатов поиска иногда становится не по себе, настолько похожие и редкие изображения находит.
                            +1
                            Спасибо, попробовал! Как минимум нашел, что это скриншот из фильма!
                            +2
                            Если картина не попала ни в какие каталоги, то в интернете ее не найти.
                            Особенно пока у каждого художника не было своего сайта.
                            Информация, увы, теряется.
                              0
                              информация не теряется! А не находится! Это большая разница. Не путайте.
                              У компании Google раньше (лет 5-10 назад) был хороший поиск… сейчас там не найти ничего. И дело не в том, что контента меньше стало, а в том, что очень много вырезается из найденного и много чего не кешируется и способы поиска не усложняются, а упрощаются. Скоро придётся платить не только за выход в интернет, но и за открытие сайтов. А поисковик будет совсем VIP сервисом для избранных. И все сайты в поисковике будут открываться за деньги :-)
                                0
                                По некоторым оценкам, гугл индексировал 0.2-4% интернета в 2014 году.
                                Не знаю, как изменяется эта цифра со временем, но держать малоиспользуемый индекс определенно дорого.
                                К тому же, поиск по картинкам весьма не идеален, а лет 5-10 назад его вообще не было :)
                                  +2
                                  Это:
                                  Экономически не выгодно

                                  выливается в живём в грязи и нищете все. Независимо от материального состояния. Огребаем все дружно.
                                    0
                                    Это тратить ресурсы на то, чем вы будете пользоваться.
                                    Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.
                                    Поддержите каких-нибудь DuckDuckGo чтобы они сделали то что вам нужно, если есть желание.
                                      0
                                      Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.

                                      Вот это «возможность» — то о чём я написал в первом посте. Это не программа или система — это человек. И нужно работать в сторону автоматизации человека в программу. Над этим сейчас никто не работает. Например у Google наблюдается обратное развитие и этот поиск находит всё меньше результатов.

                                      И не придумывайте. У нас есть ещё одно «Экономически не выгодно». Исполнителям не всегда хватает денег на студийную запись. Так что до сих пор в 2019 году выпускаются mp3 в качестве релиза.

                                      Бедность у нас не в кармане уже, а в крови и мы её просто не замечаем.
                                      0
                                      В любой сфере, где продуцирование обгоняет утилизацию происходит образование помойки. Околоземная орбита ли, города, интернет, планета целиком. Всюду, где человек вмешался, мы видим некий культурный слой, разгребать который не выгодно или попросту невозможно. Я не даю этому оценку, лишь фиксирую наблюдение.
                                      0

                                      Проценты от чего? Страницы, сайты?

                                0
                                Что-нибудь вроде «в среднем меньше одного поискового запроса в пятьсот лет» (но это не точно).
                                Раз столько еще не прошло, потенциальную популярность данных, которые никто никогда еще не искал, приходится угадывать.

                                Беглый поиск показывает, что люди интересуются только тем, как добавить свой сайт в выдачу, поэтому все статьи и официальный хелп только об этом.
                                Что происходит с данными без хозяина и коммерческой востребованности — никому не интересно.
                              0
                              Пробовал специально смотреть видео с минимумом просмотров. В основном скучная хрень: чьи-то прогулки в парке, снятые на камеру без стабилизации, какие-то латиноамериканские вечеринки с ужасным качеством, личные видео с каких-то мероприятий типа выпускного или с пятничного вечера на работе, и прочая лютая хрень. Как правило снятая очень криво и некачественно.

                              Only users with full accounts can post comments. Log in, please.