Как стать автором
Обновить

Комментарии 9

200 роликов впоследствии были удалены с платформы как нарушающие ее правила, хотя до того, как на них пожаловались добровольцы, видео успели набрать 160 миллионов просмотров в сумме.

Если ютуб знает что видео нарушает правило, то он удалит видео и не будет его рекомендовать. Если ютуб этого не знает, то факт нарушения правил не является причиной того, что ролик не будет рекомендован алгоритмом ютуба.
вероятность того, что доброволец пометит ролик как неприятный, была у рекомендованных алгоритмом материалов на 40% выше, чем у тех видео, которые они находили через поиск

Что вполне возможно если люди сами чаще кликают на «неприятные» ролики. Делать из этого вывод что рекомендательный алгоритм целенаправленно рекомендует «неприятный» ролик — ошибочно.
в 43,3% случаев рекомендация была совершенно не связана с предыдущими видео, которые смотрел доброволец

Что вполне возможно если люди сами при гулянии по ютубу чаще выбирают ролики, не связанные с предыдущим видео.
«Мы постоянно работаем над улучшением работы, и только за последний год мы внесли более 30 различных изменений, чтобы уменьшить количество рекомендаций, содержащих вредоносный контент», — говорится в заявлении компании.

Алгоритм можно улучшать сколько угодно и тратя на это сколько угодно ресурсов самого разного рода; однако если мухи отказываются лететь на мёд, то ни один рекомендательный алгоритм by design не должен им рекомендовать мёд. Эту реальность следует принять и смириться.

как я понимаю, исследованием нас хотят убедить, что, помимо интереса пользователей в том и ином виде, ютуб должен учитывать и некоторые «высшие цели».
по сути, речь идёт о введении некоторой формы цензуры.


P. S. уверен, что какая-то она там и сейчас есть. просто не та, что нравится авторам этого исследования.

У меня вообще подозрение что там вообще нет никаких алгоритмов, а сидят какие-нибудь индусы что-то мутят вручную. Например есть ролик, который набирает за год 300-400 просмотров, все идет как обычно, а потом неожиданно опс — за 3-4 дня число просмотров достигает 100к в день, причем 99% переходов идут с главной страницы. Где-то с месяц идет движуха и потом постепенно все затухает и число показов на главной странице становится не выше 1000 в день, а остаточный трафик по 5-7к просмотров вдень капает на 98% из раздела «Рекомендуемые видео», причем видео с которых переходят вообще никак не связаны ни с темой ни со стилем моего ролика, но он все равно почему-то попадает в список слева. Как это вот можно объяснить с точки зрения логичных алгоритмов? )

Цель Ютуба удержать пользователя на сайте как можно дольше. Значит надо кроме тематических роликов подмешивать и что-то новое, иначе зритель заскучает и уйдёт. Грубо говоря, передачи на ТВ канале тоже не обязательно будут тематически связаны.

30 тысяч человек, за год, нашли 3 тысячи "плохих" видео, из них удалили целых 200... Очень часто, да.. oh wait.

Ну ни разу мне там не предлагали феек, или тем более, сексуальных феек.
Да, у меня тоже какой-то другой youtube.

Слышал что в YouTube существовала суммарная метрика 1 человек 1 час видео в день как минимум. Потому что просмотры это реклама. Поэтому алгоритмы предлагали пользователям видео, которое сможет как можно дольше его удержать на платформы. И поэтому там было огромноое количество псевдонаучных видео, которые набирали миллионы просмотров, потому что были хорошо заточены на то, чтобы захватить и удержать внимяние пользователя.

Еще подумал, как бы я делал рекомендательный алгоритм. Во-первых, это будет не один общий алгоритм, а связка из разных классификаторов видео и классификаторов зрителя по когорте/профилю.

Пользователь определяется к определенной когорте или даже к набору когорт в зависимости от его активности. И видео уже рекомендуются исходя из его набора когорт. Часть видео ему не будет нравится и он будет подавать разные сигналы, что определенные видео ему не нравятся, но этих сигналов может быть недостаточно, чтобы изменить его набор когорт. Поэтому всегда часть видео будут не очень релевантны. Кроме того, система также будет ему показывать новые ролики, чтобы он помог их классифицировать их своей реакцией, и часть из них тоже не будет интересной.

Также нужно предусмотреть набор алгоритмов для запуска нового видео в ротацию, и алгоритмов тут тоже будет целый набор, в зависимости от того, что это за видео. Еще можно предусмотреть алгоритм определения потенциально вирального ролика, это нужно как с точки зрения запуска его в показ (момент показа и первые зрители), так и с точки зрения распределения нагрузки.

И понятное дело, что эта вся эта система будет работать с определенной погрешностью, отсюда и неинтересные рекомендации.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Истории