Как стать автором
Обновить

Как я создал собственный алгоритм YouTube (чтобы не тратить время впустую)

Время на прочтение 8 мин
Количество просмотров 22K
Всего голосов 43: ↑42 и ↓1 +41
Комментарии 29

Комментарии 29

Идея интересная. В YouTube иногда напрягает, что алгоритм показывает интересное видео, но если вместо его открытия случайно нажать обновление, то он показывает новую подборку.
Можно нажать «назад» в браузере и вернуться к предыдущей подборке.
увы, не всегда работает. У меня через раз — обновленная лента.
А когда (или в каком браузере) кнопка «назад» работала после обновления страницы?
Опера на своём движке.
Чумовая вещь была: (
Особенно чумовым был файл sites.js содержащий уйму строчек вида:
if (document.location == 'www.example.com') useWorkaroundForExampleCom();


Но, интерфейс был передовой — ни дать, ни взять.
А что поделать, если сайтописцы подгоняли код под глюкавый ИЕ, а при работе по стандартам все превращалось в кашу
Просто кто-то смотрит слишком много или слишком мало ютуб. У меня ютуб знает прекрасно что и когда мне подсунуть. Я сам уже пытаюсь его разбавлять кликбэйтом
По итогу получился ни к чему не привязанный сумбурный набор критериев. Видно что автор с ютубом на ВЫ, потому что подписчики уже лет 5 ничего не значат, а он еще ценность делит на старость видео. Хоть бы посмотрел как выглядят графики прироста просмотров, что они не линейные. Да и кто вообще ищет видео по таким запросам? По итогу он получил кликбейт среди кликбейтов, и в качестве примера «интересного» видео продемонстрировал кликбейт неудачного канала где у автора невыносимый акцент на разговорном видео.

Вы правы по существу, но акцент вполне себе выносимый, как по мне.

Ещё неочевидный момент — вылогиньтесь из YouTube. Любое видео, встроенное на стороннем сайте, которое вы посмотрите, занесётся в историю просмотров на вашем аккаунте и тем самым будет портить рекомендации. Когда я изолировал YouTube в отдельный контейнер и почистил историю, то через некоторое время алгоритм стал предлагать именно те видео, которые мне интересны.
НЛО прилетело и опубликовало эту надпись здесь
Не знаю, по-моему лишняя трата времени и сил. Вообще, не испытывал проблем с алгоритмами ютюб
Ну так можно и руками ничего не мастерить, а зачем, лишняя трата времени и сил, тем более все купить можно в Китае, еще и дешевле выйдет в разы.
Гугл умеет JS-скрипты по расписанию запускать. Я так ical в календарь импортирую
А я просто на PHP пишу и запускаю по крону, что 15 лет назад не имел проблем со сторонними библиотеками (почта, гугловский SDK, OAuth и т. п.), что сейчас. Можно даже курлой по HTTP запросы делать если хочется чтобы прям все было своим. Искренне не понимаю зачем тащат питон для банального обращения к сторонним REST API. Ну только если человек больше ничего не знает, но я не думаю что питон специально учат и не знают кроме него ничего.

Для painless деплоя на Lambda можете использовать фреймворк serverless.

Я изменил код программы, убрал тяжелые зависимости, но оставил логику. Загрузить на AWS Lambda можно одной коммандой ./deploy_to_lambda.
Тут исходный код: YouTube-video-finder
Судя по комментариям, многие даже не осознают насколько Youtube своими рекомендациями ограничивает информационный поток для них.
По моим ощущениям, алгоритмы youtube стараются максимально оградить пользователей от видео, которое может вызвать негатив. К примеру, если вы топите за Путина, то в ваших рекомендациях вряд ли появилось видео с расследованием Навального. И, наоборот, я не встречал видео Соловьёва у себя в рекомендациях. Такое положение приводит как правило к радушию в комментариях и к ещё большему убеждению в своих взглядах.
Это только одна из проблем алгоритмов ранжирования соц сетей. Как их решать я не знаю. Нужно повышать осведомлённость людей о том как эти алгоритмы работают. Возможно, стоит предоставлять пользователям возможность использовать какие-то альтернативные алгоритмы с другими настройками.

Вроде бы количество просмотров убывает со временем не линейно, а по экспоненте или типа того. Может, это позволит улучшить формулу ранжирования.

Эм… товарищ пытается обогнать продвинутую нейронку, обученную на 100500 терабайтах данных, с помощью формулки с тремя параметрами?

С одной стороны я с вами согласен, с другой стороны та нейронка решает кучу задач для кучи пользователей и самой компании, а эта формула решает одну задачу одного пользователя. Работая с упрощённой задачей превосходства достичь можно, но только для этой задачи и этого пользователя.

Продвинутая нейронка решает не ваши задачи, а задачи компании, а именно, чтобы пользователи в среднем приносили больше денег и реже уходили с сайта.
То что вы ищете условно коньяк 50 летней выдержки, а вам выдают барматуху, за который рекламодатели проплатили — это ваша проблема, а не компании.
Почему-то комментарии имеют негативную окраску. А ведь автор пытается решить фундаментальную для всех нас проблему: автоматизированная обработка [персональной] информации не самым кустарным (ок, это дискуссионно) способом. Лично меня хватило только на то, чтобы убить все подписки, убить всю историю просмотра (и продолжать ее чистить сразу после не релевантного моим интересам), выбрать очень ограниченное число каналов, чтобы получать в предложение ограниченное количество роликов близких моим интересам. Алгоритм самого YouTube никогда не будет персонально вашим по понятным причинам. У нас просто пока нет хорошего инструмента для выражения вот этого самого «интереса», как процесса отбора, а не процесса поиска. Мне кажется, решение такой проблемы заслуживает поддержки.
p.s. имел ввиду, что весь мой алгоритм свелся к «ограничению», поэтому как бы стал релевантен. Но это фикция на самом деле. Возможно, на расстоянии клика от меня лежит ролик объясняющий про осциляции нейтрийно понятнее (качественнее соответствует моему интересу понимания этой темы), но как я теперь узнаю об этом?
А зачем убивать все подписки, позвольте поинтересоваться?
Было много подписок по разным темам. После пробуждения интереса к физике, понял, что все остальное можно отправить на периферию (на другой акк), интереснее на ближайшие лет 5 ничего не будет.
Если чисто технически, то для получения предсказуемой модели. Нет подписок --> появилась единственная --> вижу в предложке видео с этого канала и связанные (ключевыми словами) по теме (рядом с роликом при просмотре).

Рекомендации ютуба вполне себе неплохие
Вы вот попробуйте Дзен настроить :)

А есть возможность отбрасывать уже просмотренные видео? Именно это было киллер-фичей, по моему мнению. Сейчас рекомендации у меня на 80-90% состоят из просмотренных:(
Жаль на самом ютубе никогда не будет предложек по такому принципу
Зарегистрируйтесь на Хабре , чтобы оставить комментарий