Мы в IVI столкнулись с проблемой низкого доверия к контенту, который пользователи встречают впервые. Одна из причин — неинформативные и непривлекательные постеры. Чтобы исправить эту ситуацию, мы научились персонализировать постеры, выбирая для пользователя более понятные и привлекательные изображения. Мы провели эксперимент, который показал, как на самом деле важна для зрителя визуальная составляющая при выборе контента.
Постер — это первая точка, в которой происходит визуальный контакт зрителя с фильмом на сайте онлайн-кинотеатра. Именно он определяет привлекательность контента при первой встрече с ним. Человек должен узнать кино по постеру или хотя бы понять по изображению, о чем оно.
Например, постер фильма «Джон Уик» дает много информации о фильме: по нему можно узнать жанр кино, понять его атмосферу и стиль, осознать, что перед нами история одного героя и даже немного вникнуть в его характер. Если такой пазл не складывается, пользователь решает, что контент ему неинтересен, даже если кино известное, и уходит недовольным.
В каталоге онлайн-кинотеатра IVI десятки тысяч фильмов. Когда система рекомендаций предлагает пользователю один из них, зритель в первую очередь смотрит на постер. Если этот постер непоказательный, зритель ниже оценивает качество рекомендаций. Если таких постеров много и пользователь видит их из раза в раз, ему кажется, что сервис не обновляется, доверие к нему снижается, желание пользоваться пропадает.
У нас появилась цель повысить доверие к рекомендациям, чтобы пользователь, даже если не способен идентифицировать контент по постеру, верил, что контент может ему понравиться. Был необходим механизм, который сделает контент более узнаваемым, поможет зрителю понять, о чем кино. При этом картинки должны были стать динамичными, чтобы каждый раз пользователь видел что-то новое.
Решением стала персонализация постеров для каждого пользователя в моменте времени.
Первый вопрос, который возник: как понять, какой постер нравится пользователю больше, а какой меньше? Мы решили обратиться к подборкам фильмов на IVI. Контент в рамках одной подборки всегда имеет общую семантику, отсортирован по релевантности, интересам пользователя. Гипотеза состояла в том, что если зритель выбирает один из таких похожих фильмов, то он будет опираться на более понятный и привлекательный постер.
Для всех ситуаций, когда пользователь кликнул на фильм в подборке, мы стали собирать информацию о том, какие постеры он вообще видел в этой подборке до момента клика. На основании этих данных мы выстроили модель машинного обучения learning to rank. Построили двойки постеров, один из которых оказался для пользователей более привлекательным, чем другой. Обучили нейросеть распознавать и запоминать, какие детали определяли привлекательность.
Как это работает. Каждый постер мы обозначаем как набор определенных визуальных образов и информации — набор, закодированный в специальный вектор. Этот вектор получается в результате работы модели машинного обучения, которая предсказывает, насколько картинка привлекательна. Мы пропускаем через сеть постер и получаем вектор, который описывает его привлекательность.
Параллельно мы создаем модель пользователя, которая описывает отношение к картинке. Перемножая векторы пользователя и постеров, мы оцениваем каждую картинку с точки зрения пользователя. Чем выше оценка, тем привлекательнее постер для пользователя.
Чтобы проверить эффективность персонализации постеров, в конце 2021 года в IVI провели онлайн-эксперимент с тремя группами. Первой показывали один постер для одного фильма. Второй группе показывали персонализированные постеры, выбранные из альтернативных с помощью машинного обучения, и постер менялся раз в день. Третьей группе показывали один случайно выбранный постер из альтернативных, постер не менялся в течение дня.
Стоит оговориться, что работа велась только с определенным подмножеством контента. Те фильмы, которые требовали сложного согласования или у которых не было альтернативных постеров, не участвовали в эксперименте.
Эксперимент проходил в ноябре — декабре 2021 года на платформах Smart TV (LG, Samsung) и web (IOS). Результаты подтвердили успех новой модели: внутри группы, которой показывали персонализированные постеры, CTR и конверсия в просмотры были самыми высокими.
Сейчас персонализация постеров применяется на всей платформе IVI (исключая контент, у которого нет альтернативных постеров). Пока что ни один другой онлайн-кинотеатр в России не применял такую технологию.
В наших планах улучшить персонализацию постеров. Сейчас основная гипотеза не учитывает, что зритель выбирает фильм не только по постеру, но и по жанру, по краткому описанию. Модель персонализации будет совершенствоваться дальше уже с учетом жанра и описания фильма.
Ситуация
Постер — это первая точка, в которой происходит визуальный контакт зрителя с фильмом на сайте онлайн-кинотеатра. Именно он определяет привлекательность контента при первой встрече с ним. Человек должен узнать кино по постеру или хотя бы понять по изображению, о чем оно.
Например, постер фильма «Джон Уик» дает много информации о фильме: по нему можно узнать жанр кино, понять его атмосферу и стиль, осознать, что перед нами история одного героя и даже немного вникнуть в его характер. Если такой пазл не складывается, пользователь решает, что контент ему неинтересен, даже если кино известное, и уходит недовольным.
Проблема
В каталоге онлайн-кинотеатра IVI десятки тысяч фильмов. Когда система рекомендаций предлагает пользователю один из них, зритель в первую очередь смотрит на постер. Если этот постер непоказательный, зритель ниже оценивает качество рекомендаций. Если таких постеров много и пользователь видит их из раза в раз, ему кажется, что сервис не обновляется, доверие к нему снижается, желание пользоваться пропадает.
У нас появилась цель повысить доверие к рекомендациям, чтобы пользователь, даже если не способен идентифицировать контент по постеру, верил, что контент может ему понравиться. Был необходим механизм, который сделает контент более узнаваемым, поможет зрителю понять, о чем кино. При этом картинки должны были стать динамичными, чтобы каждый раз пользователь видел что-то новое.
Решение
Решением стала персонализация постеров для каждого пользователя в моменте времени.
Первый вопрос, который возник: как понять, какой постер нравится пользователю больше, а какой меньше? Мы решили обратиться к подборкам фильмов на IVI. Контент в рамках одной подборки всегда имеет общую семантику, отсортирован по релевантности, интересам пользователя. Гипотеза состояла в том, что если зритель выбирает один из таких похожих фильмов, то он будет опираться на более понятный и привлекательный постер.
Для всех ситуаций, когда пользователь кликнул на фильм в подборке, мы стали собирать информацию о том, какие постеры он вообще видел в этой подборке до момента клика. На основании этих данных мы выстроили модель машинного обучения learning to rank. Построили двойки постеров, один из которых оказался для пользователей более привлекательным, чем другой. Обучили нейросеть распознавать и запоминать, какие детали определяли привлекательность.
Как это работает. Каждый постер мы обозначаем как набор определенных визуальных образов и информации — набор, закодированный в специальный вектор. Этот вектор получается в результате работы модели машинного обучения, которая предсказывает, насколько картинка привлекательна. Мы пропускаем через сеть постер и получаем вектор, который описывает его привлекательность.
Параллельно мы создаем модель пользователя, которая описывает отношение к картинке. Перемножая векторы пользователя и постеров, мы оцениваем каждую картинку с точки зрения пользователя. Чем выше оценка, тем привлекательнее постер для пользователя.
Результаты
Чтобы проверить эффективность персонализации постеров, в конце 2021 года в IVI провели онлайн-эксперимент с тремя группами. Первой показывали один постер для одного фильма. Второй группе показывали персонализированные постеры, выбранные из альтернативных с помощью машинного обучения, и постер менялся раз в день. Третьей группе показывали один случайно выбранный постер из альтернативных, постер не менялся в течение дня.
Стоит оговориться, что работа велась только с определенным подмножеством контента. Те фильмы, которые требовали сложного согласования или у которых не было альтернативных постеров, не участвовали в эксперименте.
Эксперимент проходил в ноябре — декабре 2021 года на платформах Smart TV (LG, Samsung) и web (IOS). Результаты подтвердили успех новой модели: внутри группы, которой показывали персонализированные постеры, CTR и конверсия в просмотры были самыми высокими.
Сейчас персонализация постеров применяется на всей платформе IVI (исключая контент, у которого нет альтернативных постеров). Пока что ни один другой онлайн-кинотеатр в России не применял такую технологию.
Перспективы
В наших планах улучшить персонализацию постеров. Сейчас основная гипотеза не учитывает, что зритель выбирает фильм не только по постеру, но и по жанру, по краткому описанию. Модель персонализации будет совершенствоваться дальше уже с учетом жанра и описания фильма.