Как стать автором
Обновить

Рекомендации в Okko: как заработать сотни миллионов, перемножив пару матриц

Время на прочтение 20 мин
Количество просмотров 33K
Всего голосов 70: ↑61 и ↓9 +52
Комментарии 31

Комментарии 31

Всё, с сегодняшнего дня запустили рекламную кампанию на полную?
Куча умных диаграмм и графиков, рассуждения о том, что надо последовательно развивать сервисы, а не гнаться за сию минутным эффектом.
И тут же сегодня мы узнаём цену на трансляции матчей АПЛ. Которую ничем иным, кроме как «надо бы сразу по максимуму маржу снять» не объяснить. Народ уже вовсю ругается, что урежь цену в 2 раза — профита было бы куда больше. Что 200р. в день (или 500 в месяц) — это сильно завышенная цена за такую специфику. Что нет наконец возможности подключить пакет с матчами одной любимый команды (хотя в статье очень много расписано про машинное обучение рекомендательных систем...).
Не, не взлетит…

Странно думать, что эта статья была написана ради рекламной кампании АПЛ. То что дата публикации совпала с анонсом цен – совпадение.


По поводу ценообразования могу лишь напомнить классическую диаграмму:


Картинка

image

Есть масса примеров, когда дешево — очень качественно. И, что не маловажно, остутсвутют любые ограничения по локации. А так статья очень познавательная.
А то, что пост появился в «лучшем» с нулём комментариев — тоже совпадение?

"Лучшее" – это просто лента постов за день, отсортированная по рейтингу. Утром постов мало и даже новый пост с небольшим рейтингом может там оказаться.


Если честно, я был бы только рад заплатить хабру за трафик и промоутинг, но такой возможности, к сожалению, нет.

А вы пробовали объяснить? По информации отсюда:
Права стоят 7 млн. евро, что примерно 511 млн. рублей. Аудитория около 175000. Сезон идет 10 месяцев, поэтому если все будут брать подписку по почти самому невыгодному варианту 549 месяц получаем доход — 960 млн. рублей. Расходы на железные и людские ресурсы мне неизвестны. Но я уверен, что многие купят подписку заранее по 3000 рублей, тогда доход составит вообще 525 млн. рублей, а прибыль за счет неизвестных издержек будет отрицательной. Поэтому негодование по поводу цен мне совершенно непонятно. Да и 500р — это один раз в кино сходить, что-то бунтов по поводу цен не наблюдается.

P.S. Мне вот придется покупать и их и МатчТВ, ибо еврокубки.

500р — это один раз в кино не сходить, один раз пива не попить, один раз не пообедать и т.д.
Всякий раз когда тебе пытаются втюхать какой-то сервис (обычно из медиа-индустрии) ссылаются на этот «один раз». Проблема в том, что в итоге этих «разов» набирается столько… Хотя многие люди и не против заплатить, но только за всю пачку контента, а не по каждому чиху бежать доплачивать ещё 500р, обмазываться всякими платформами и т.п.
Ну и основная моя претензия что пока известно только о том, что куплены права и главным назначили Стогниенко. Всё. Ни форматов, ни технических подробностей. Непонятно вообще насколько всё это будет смотрибельно. Зато ценники уже развесили.
Считайте тогда лучше не в разах, в рублях в час за развлечение. Поход в кино 500р за 2 часа, покупка трансляций АПЛ — 2+ часа, лично для меня часов 6(3 игры) минимум.
По фильмам у Okko неплохой сервис в плане качества, поэтому не думаю, что футбол они в 360p будут показывать. Главное, чтобы приложения в телевизоре это умело…

P.S. Но это все оффтопик, я статью никак не осилю, с телефона не удобно ее читать было.

А теперь, представим что пользователь это не индивид, а множество…
Вся рекомендательная система сразу же ломается в хлам.

Аккаунты, которыми пользуются сразу несколько человек, – один из главных пунктов нашего плана развития. Самое правильное решение здесь – перед началом сеанса спрашивать кто сейчас смотрит.

Вряд ли кто ответит честно — и так всем надо чрезмерно много неочевидно зачем нужных данных, и людей это выбешивает. Скорее перспективно угадывать по устройству, времени и дню недели, таймингам между нажатиями… но вот как подготовить датасет для обучения, не зная таки, кто именно смотрел?
Или всё же полученная сейчас модель и так дает нечто среднее, взвешенное по активности между всеми членами семьи, и все ок? Не пробовали ради интереса смешивать два случайных акка, и смотреть после этого на точность?

Или всё же полученная сейчас модель и так дает нечто среднее, взвешенное по активности между всеми членами семьи, и все ок?

Нет, далеко не всё ок. Есть известные кейсы, когда вся семья пользуется Okko и в рекомендациях полно мультиков, т.к. ребёнок, естественно, смотрит больше всех. Для родителей такие рекомендации не релевантны и они туда не заглядывают. Хотя там и может быть ~20% релевантного родителям контента, но они не будут выискивать его среди кучи не релевантного.


Вряд ли кто ответит честно — и так всем надо чрезмерно много неочевидно зачем нужных данных, и людей это выбешивает.

Ну, если пользователь хочет получать релевантные персональные рекомендации и понимает, что без выбора своего профиля их не получить, то выбора у него не будет.


Скорее перспективно угадывать по устройству, времени и дню недели, таймингам между нажатиями… но вот как подготовить датасет для обучения, не зная таки, кто именно смотрел?

Это ОЧЕНЬ сложная задача, которая совершенно точно не может быть решена с идеальной точностью. Соответственно, всегда будут ошибки и всегда будут недовольные пользователи. Спрашивать пользователя – вполне нормальная практика. Так делает, например, Netflix, а опыта в UI/UX у них полно.

Самое простое предположение, по времени.
это банальная характеристика которую криво учитывают.


Например:


  • подруга смотрит что-то днем или с утра, потому как специфика работы. (+2 датасета, т.к. утренне и дневное кино может быть разным по предпочтениям)
  • я прихожу после 6 и мы можем смотреть что-то интересное нам обоим (+1 датасет)
  • далее подруга уходит спать например, а я могу посмотреть что-то интерестное только мне (+1 датасет)
  • на сторонним телеке в другой квартире моим аккаунтом пользуются родители (+n датасет).

итого 2 индивида по хорошему порождают минимум 4 поведенческих набора предпочтений.


всякие переключения профилей, это из категории "не решать задачу"
и давайте будем честны, это скрип зубов менеджеров, т.к. теперь мы знаем, что пользуясь 1 аккаунтом, на самом деле нас "орда семейная" .

Не знаю почему вас заминусовали. Видимо это одинокие бездетные строители рекомендательных сетей.
Следующий шаг — чтобы кто-нибудь за меня этот фильм и посмотрел…
фильмы и сериалы из более чем десяти тысяч единиц контента

А Терминатора 2 нет.

¯\_(ツ)_/¯

Теперь есть.

Спасибо за подробную статью!

Один комментарий.

мы всё-ещё храним небольшую группу пользователей, которые никогда не получали персональные рекомендации

Если использовать эту группу несколько раз в качестве контрольной, то начиная со второго аб-теста результаты могут сильно поехать из-за смещения, образованного эффектом «памяти» пользователей.

Отличная статья, спасибо!

Ничего не понятно, но очень интересно
Сервис неудобный, за каждый чих — плати. Пользуюсь нетфликсом, очень удобно, нет проблем с переключением аккаунтов, одна подписка, полный доступ. Здесь же куча каких-то граблей.

На Netflix гораздо меньше библиотека, если не считать их оригинального контента. Например, там никогда не будет новинок, потому что студии не открывают подписные права на новинку ни для одного игрока рынка. У нас же новинки будут доступны для покупки.

Вы сконцентрируйтесь на юзабилити и на понятных подписках. Чтобы у вас начать смотреть фильм у меня ушло минут 15 с «втыканием» куда жать и почему я подписку оформил, а за фильм, который я хочу посмотреть, мне надо доплачивать. Я понимаю, что у вас там модель монетизации какая-то, но блин для пользователей это вообще неочевидно! Должно быть 3 клика и 30 секунд потраченного времени в идеале. на Нетфликсе все интуитивно понятно. Я бы посоветовал сначала сделать сервис «Для людей», а потом думать о монетизации. зато вы пишете про алгоритмы рекомендаций) да они никому не будут нужны))
это справедливо. И нетфликс также это понимает, поэтому некоторая часть новинок уже собственного производства )
Спасибо за статью, насколько решения с хакатона были сильны по сравнению с вашим решением? (если конечно же честно обучаться на тех же данных)

Скор первого места – 0.048, скор нашей системы на тех же данных – 0.061. Но тут нужно принимать во внимание смещение, вызванное работой продуктовой системы во время сбора данных.

У меня сейчас оценено около 2000 фильмов, мультов и сериалов, и могу сказать, что никакая система рекомендаций тут уже не поможет, потому, что я просто всё хорошие фильмы или те что по моему вкусу я уже посмотрел.

Хорошая статья. Половину после первого прочтения не понял (буду вникать по второму разу), но сама тема формирования рекомендаций очень значимая для операторов VoD-контента. Для спортивного интереса и оценки своего видения поучаствую в песочнице на Boosters.


Для себя сделал некоторые выводы:


  • В основной массе все смотрят новинки. Т.е. если в VoD-сервисе присутствуют "рекомендации" в виде простого списка новинок по дате релиза или по рейтингу за определённый интервал времени, основная масса будет ориентироваться именно на такие рекомендации. Подобные "рекомендации" никак не связаны с предыдущими действиями пользователей.
  • Рекомендации другого вида нужны не потребителю, а оператору, чтобы продвигать определённый контент. Пользователь будет ориентироваться на рекомендации в любом случае (он просто любит рекомендации и советы), достаточно лишь приблизительно соответствовать его потребностям и не дискредитировать саму систему рекомендаций, например, перекосом из-за маржинальности, которая может разочаровать потребителя. Т.е. рекомендации больше важны для VoD-сервиса, чем для потребителя, чтобы продвигать свои интересы. Чтобы навязать требуемый контент, а вовсе не для того, чтобы пользователь получил больше подходящий ему контент.
  • Для рекомендаций важны внешние факторы, которые не связаны с внутренними действиями пользователя. Т.е. ускорять продвижение требуемого контента можно на основе внешних факторов.
  • Локальный рейтинг контента (отдельного небольшого VoD-сервиса) важен лишь для визуальной манипуляции в рекомендациях. Для реальных рекомендаций большее значение имеет глобальный рейтинг уровня КиноПоиск, IMDb и пр.
  • Флаг "новинка" в совокупности с подачей информации имеет большую ценность при выборе потребителем, чем рейтинг.

И когда вы в Okko добавите поддержку автофреймрейта (preferredDisplayModeId) в версии для Android TV? (в последний раз, когда смотрел вашу программу, поддержки не было)

И когда вы в Okko добавите поддержку автофреймрейта (preferredDisplayModeId) в версии для Android TV? (в последний раз, когда смотрел вашу программу, поддержки не было)

Передал пожелание в отдел разработки.

Все хорошо и сервис на самом деле нравиться, но не нравятся цены. А самое обидное, что покупаешь фильм, а там редкостное г***о и деньги зря потрачены. В кино хожу редко, т.к. там давно смотреть нечего. А вот стоила бы подписка руб. 300 в месяц на все фильмы и в качестве бонуса фильм 2019 года в подарок — я бы заплатил и не жаловался. )
Зарегистрируйтесь на Хабре , чтобы оставить комментарий