Pull to refresh

Comments 10

Отличная статья! Как детектив. Прочитал на одном дыхании. Спасибо за перевод.
Довольно странный подход к категоризации.
Почему вместо жанра «оскарносные романтические комедии 1950х» не сделать тэги oscar, romantic comedy, 1950?
Это же в разы уменьшит количество сущностей которые нужно хранить в базе. Хотя вполне возможно что они так и записывают все раздельно, а пользователям просто показывают объединенные тэги для красивости.
Но если так то я не очень вижу в чем новизна подхода, разнообразие тэгов это весьма старая идея, у нетфликса возможно подход более основательный, но не более.
Например потому, что жанр «оскарносные романтические комедии 1950х» — это на самом деле название кластера в многомерном пространстве параметров фильма. Каждый фильм, после проставления ему всех параметров по тому 36-страничному документа, это точка в N-мерном пространстве (судя по всему, там больше 100 параметров, то есть больше 100 измерений). Каким-то образом, на основе уже имеющейся базы оценок, точки объединяются в кластера, и для названия кластера выбираются наиболее значимые измерения.

Когда пользователь смотрит фильмы, рекомендательная система вырисовывает области предпочтений в том N-мерном пространстве, и ищет наиболее близлежащие кластера, и их подсовывает пользователю.
Это самое интересное из того, что я читал за месяц.
Очень понравилась идея, что в контенте есть некие «пакеты энергии» эмоционального характера.

С загадкой Берра ставлю на то, что на каком то этапе все серии запроцессились как отдельный фильм, таким образом их общие черты получили мощный множитель.
У меня есть теория про Бёрра: дело в том, что про фильмы с Мерил Стрип можно и без того подобрать множество эпитетов, не обязательно каждый раз упоминать ее имя, в вот про фильмы с этим Бёрром сказать больше нечего кроме того что это фильм с Бёрром, вот и ставят на его фильмы этот тег постоянно те кто занимается там их присваиванием.
Я думаю, что всем фильмам автоматом добавляются в параметры все звезды, которые в нем играли. это же самое простое, что можно автоматизировать, решая задачу категоризацию фильмов.
Интересно, а происходит ли потом коррекция пользовательских предпочтений? Ведь вкусы меняются.
Спасибо за материал. Интересно как российские компании решают подобные задачи
Боюсь, они об этом еще даже и не задумывались
Sign up to leave a comment.