Pull to refresh

Comments 70

UFO just landed and posted this here
Надо, чтобы рекомендательный сервис не закрывался без возможности переноса оценок в другой сервис. В третий сервис я не могу уже заставить себя вбивать все фильмы по новой (да и нет их).
RIP кинобаза, RIP имхонет.

По GDPA сервисы должны предоставлять выгрузку всей накопленной о юзере информации, т.е. его оценки в том числе.

Когда GDPA появился — кинобаза и имхонет были уже мертвы. Да и какая разница — кинобаза предоставляла выгрузку. Предоставляла ровно до того дня, когда закрылась без предупреждения (ну ок, они большую часть баз дропнули, а восстанавливать уже не захотели и просто закрыли проект). С имхонета после объявления о закрытии я тоже выгрузку сделать так и не смог.
И залить эти выгрузки в любом случае было (и есть) некуда.
Imhonet был шикарен. Лет 10 назад он порекомендовал мне фильм 1984, я тогда ещё подумал, что нафига мне какой-то старый чёрно-белый фильм с рейтингом около 7, но имхонет был непреклонен и писал что-то типа «с вероятностью 90% вы оцените этот фильм на 9 из 10». Я сдался и ни разу не жалею. Все остальные рекомендации были на подобном (бесподобном) уровне.
Потом имхонет закрылся, потому что у его владельца был так же строительный бизнес, на котором он и решил сконцентрироваться. Потом пошла волна, «не покупайте у него недвижку, он вас в любой момент может кинуть как с имхонетом».
После этого появилась возможность выгрузки оценок, чем я сразу же воспользовался, у меня их было около 700.
Потом Кинопоиск добавил возможно импорта оценок из имхонет. Чем я тоже воспользовался, но кинопоиск мне так ничего и не порекомендовал, писал «Недостаточно оценок, оцените фильмы из топ-500» и это при наличии 700 оценок.
В imdb был только экспорт, я вручную проставил оценки для фильмов, которые я оценивал на 9-10, но никаких внятных рекомендаций так и не получил.
Короче с тех пор я не пользуюсь рекомендательными системами и выбирать фильмы стало сильно сложнее.
А всё могло сложиться иначе, если бы все оценки за 10 лет выложили в общий доступ без привязки к персональной информации, тогда мог бы появиться новый рекомендательный сервис.
PS: строительная контора, в пользу которой был закрыт имхонет, в итоге обанкротилась, а владелец свалил заграницу :)
Да, кинопоиск в части рекомендаций расстроил. Я добирался до персональных, там всякие Зеленые Мили и прочее из топ-500 (не то, чтобы я считал эти фильмы плохими, но я такое вообще не смотрю (лучше почитать), а оценки проставлял исключительно комедиям и около того).
Надо чтобы рекомендательный сервис принимал список просмотренного кино, даты просмотра и его оценки.

Напомнило яндексовский опросник

Экспертные советы — хороший подход, может из 10 советов ты 5 уже смотрел, 3 не интересны а 2 уже можно задуматься. А так колёсишь по нету в поисках посмотреть но более половины предлагаемых уже смотрел остальная не интересна. И порой самое интересное что телевизор с ТВ1000 подкидывает интересные идеи для просмотра, даже фильмы начала 00х годов которые ты пропустил. Раньше, пока не закрыли torrentsmd, там была рубрика популярные торенты за сегодня / 3 дня. И порой выручало.
1. Синхронизируемся с экспертом.
2. Эксперт продаётся диснею/марвелу/…
3. Смотрим одни комиксы.

Реальная история.

Зритель ищет в кино определенную гамму эмоций, соответствующую текущему настроению и ситуации. Думаю алгоритмы можно улучшить, если зайти с этой стороны.

Тоже во время прочтения статьи постоянно об этом думал. Говоря за себя, я могу захотеть пересмотреть Темного рыцаря не потому, что там Бэтмен, не потому, что играет его Кристиан Бэйл, и не потому, что фильм снял Нолан, а потому, что у фильма своя мрачная атмосфера, и мне хочется погрузиться в нее. Соответственно какой-нить Отряд самоубийц или Мстители тут совсем никак не подойдут.
UFO just landed and posted this here
Короче, нейросети нам не помогут, потому что наше подсознание — тоже нейросеть.

А в чем противоречие? Есть большая сложная нейросеть А в голове конкретного зрителя, есть маленькая простенькая сеть Б на сервере рекомендательной системы. Сеть Б это упрощенная модель сети А, которая должна давать максимально близкий выход к выходу сети А, вход — это информация о конкретном фильме + шум, неизвестный сети Б (эмоции и потребности в момент просчета выхода сети А). Выход — это некая метрика (чем выше, тем больше понравился фильм).
Глубинные слои (гиперпараметры) сети Б обучаются по большому датасету на много зрителей. Параметры сети Б обучаются по действиям конкретного зрителя.
Понятно, что если можно было бы просчитать А на всех фильмах в БД, то Б не нужна. Так же выходит, что мы выбираем между двумя неидеальными вариантами.
1) запускать классную сеть А на малом наборе данных (фильмах, о которых может прочитать зритель)
2) запускать сеть Б на полном наборе данных (фильмы всех времен и народов).
Вполне может быть, что вариант 2 покажет результат лучше за счет большей выборки.


Условно, если 10% фильмов конкретному зрителю заходит, то выбрать 1, прочитав о 10, это сложная задача, ведь этот 1 фильм может в эти 10 и не попасть. А вот выбрать 1 из 20000, который попадет в топ 2000 конкретного зрителя — задача намного проще

Когда-то я хотел купить зонтик. За пару дней изучения вопроса я выбрал модель и продавца. И купил зонтик. Потом ещё несколько дней гугл и фейсбук мне навязывали рекламу зонтиков, хотя эта тема для меня была уже совершенно не актуальна.
Рекомендательные системы не так же работают? Они просто дают то, что мне нужно было в прошлом. Конечно, если кто-то очень любит именно "зонтики", то это было бы очень удобно…

Ваще ниачём. Сотрите вам память и вы броситесь смотреть все хитовые вещи последних 40 лет. Проблема в том, что вы просто закушались и уже знаете "о чем фильм" даже если его ещё не смотрели, сюжеты-то похожи. Всё реже и реже среди новинок появляется что-то, что вас цепляет уже по трейлеру — это растёт ваш опыт, ваше знание сюжетов. Это нормальный процесс. Изучай списки где снялись любимые актеры — можно не из-за сюжета смотреть, а из-за актера. Когда и это наскучит, иди лучше творить — софт, музыку, книги писать, статьи и т.п., или в реале — ремонт, стройка, спорт...

Добавьте ещё повышение планки ожидания. Посмотрев несколько хороших фильмов, вы не сможете получить удовольствие от большинства других, захочется чтобы «не хуже». а таких очень мало.
Например, после " Экспансии" я не могу смотреть драных «Килджоев», хотя поначалу нравились. Лучшее враг хорошего.
Экспансия — как низок ваш уровень ожидания…
Хоть вы и правы, вы не решили поставленную задачу. Но, зато решили ненужную другую — как «забраковать» для экспертной системы такого клиента (которому маловероятно помочь). Это не даёт выхода из ситуации, т.к. это уход от проблемы, а не её решение.
Какое-то время назад тоже задумывался над этой проблемой листая бесконечные постеры рекомендованных фильмов на Netflix. Тогда мне казалось, одна из проблем всех этих рекомендаций — отсутствие внятного объяснения почему система считает что этот фильм может быть мне интересен. Как результат запилил свою рекомендательную систему — рекомендует фильмы по простому принципу — «тебе понравится это кино, потому что тебе понравилось это и это кино с этим актером и так же эта актриса из другого кино которое тебе тоже понравилось». Получилось вполне неплохо, дейвствительно хорошие рекомендации. Кому интересно — lucidmovies.com.

Сейчас правда забросил, т.к. не нашел простой выход на монетизацию.
А там русской локали вообще нет? Многие названия переводили так, что даже близко непонятно, что этот тот самый фильм.
Нет, изначально ориентировался на англоязычный мир. Источник www.themoviedb.org вроде бы позволяет брать инфу на местных языках, но качество, я думаю, будет сильно ниже.

В рекомендательных системах не хватает опции "тебе не нужен фильм, тебе нужно Х". Как только расширится набор рекомендаций и он будет корректироваться под текущую активность пользователя, всё сложится.


Лента Фейсбука работает близко к общей рекомендательной системе. Фейсбук знает лучше, что вам понравится именно сейчас.


Не нужно тешить себя чувством уникальности, базовые потребности у всех одинаковые, их ограниченное количество, важно просто накопить статистику по лично вам в широком круге рекомендаций и система будет успешно предсказывать то, что даст вам удовлетворение и/или удовлетворение рекламодателю именно сейчас.

Моя основная проблема при выборе фильма это ниочемные описания фильмов родом из газет 2000-х. Ну например
Айван Лок — примерный семьянин и успешный руководитель строительства. Завтрашний день — один из важнейших в его жизни, его ждет карьерный рост. Но вечером раздается телефонный звонок, который перевернет его жизнь с ног на голову.
Как именно перевернет? Это будет драйвовый боевик или же психологический триллер? Из описания ничего не понятно.
Тайлер — беспечный студент, который никак не может найти общий язык с окружающим миром. Он подавлен смертью старшего брата. Отцу, как, впрочем, и матери с отчимом, нет до него никакого дела. К счастью, у него есть друг Эйдан. Однажды парни случайно ввязываются в уличную драку…
Вот еще пример. Опять ничего не понятно. Все так боятся спойлеров что описания превращаются в скукоту которая не описывает фильм от слова совсем.
UFO just landed and posted this here
А какое описание к Локу по-вашему было бы хорошим? (хотя бы примерный набросок)
ну вот в википедии отличное описание. Фильм описан в общих деталях.Теперь я могу решить хочу я смотреть этот фильм или поищу что-то другое
Айвен Лок (Том Харди) работает прорабом. Завтрашний день — один из важнейших в его жизни, его ждет карьерный рост. Но вечером раздается телефонный звонок, который перевернет его жизнь с ног на голову. Накануне важнейшего события на стройке он вынужден ехать в Лондон ночью, чтобы присутствовать при родах внебрачного ребёнка от женщины Бетан, которую он толком и не знает. Измену ему предстоит раскрыть жене Катрине, от которой у него двое детей.

Также, его мучают простуда и начальник Гарет, а свою работу ему приходится доверить неопытному Доналу. Он продолжает бороться с проблемами в работе и личной жизни, сидя в салоне движущегося автомобиля весь фильм, принимая и совершая звонки. В финале зритель будет вознаграждён — главный герой приедет к месту назначения, и впервые камера выйдет за пределы внутреннего пространства авто, в «большой мир».
Описание задает проблематику фильма и общий контекст, не более, а вы скинули пересказ сюжета.

И кстати говоря, это называется синопсис, а не описание, синопсис не должен описывать фильм или рассказывать сюжет.
По этому краткому пересказу я могу решить стоит мне смотреть фильм или нет. Это гораздо лучше синопсиса которым пользуются сейчас или трейлеров с лучшими моментами фильмов
Рекомендательные системы это полбеды.
С другой стороны смотреть то нечего. Некоторые корейские дорамы будут получше распиаренного фильма с бюджетом в несколько сот лимонов. Те же фильмы DC (я ни в коем разе не хочу обидеть фанатов) отличаются просто детской мотивацией персонажей, как это можно смотреть? На их фоне какойнить судья дред уже просто шедевр глубины мысли)

ЗЫ я для себя проблему решил просто SG-1, SGA, SGU, House M. D., Mentalist, Fringe, Fairy Tail по кругу)
UFO just landed and posted this here
С другой стороны смотреть то нечего. Некоторые корейские дорамы будут получше распиаренного фильма с бюджетом в несколько сот лимонов.

Во втором предложении вы предлагаете решение проблемы, обозначенной в первом. Расширяйте свои границы, есть сотни очень хороших фильмов, которые просто не представлены в массовой культуре.

Почему-то в статье не поднимается вопрос рекомендации для мужа и жены, у которых разные интересы.
Для одного человека, если он конечно работает, и не сторожом, вопрос выбора что посмотреть не стоит, наоборот времени нет

Лично у меня проблема диаметрально противоположная — я точно знаю, что хочу, и посмотрел так много фильмов, что их уже не осталось.

У меня наоборот, столько фильмов еще не смотренных, не только свежих, но начиная даже с 2000-х, но банально жалко времени, которого всего 1,5-2 часа свободного в день. Тешу себя мыслью, что вот на пенсии и посмотрю все что хотел )).
вот на пенсии и посмотрю все что хотел

Ага, и поиграю во все купленные в Стиме игры, конечно.
Я конечно не знаю какая у вас насмотренность, но всего это заблуждение.
Альтернатива процедуре выбора фильма для «посмотреть в компании» да и для себя — лежать, смотреть в потолок и думать всякую ерунду. Либо придумаешь чем полезным заняться, либо заснёшь, либо вспомнишь что давно хотел/хотели посмотреть. А еще книги есть…
В целом проблема вообще странная, вроде как на хабре собирается народ которому есть чем заняться.
Почему же странная? Я не так давно побывал на конференции по data science, был только на первом докладе правда, и там ребята делились своими подходами в решении задач всяких соревнований по анализу данных и разработке нейронок. Так вот, из 4-х выступающих 3 решали проблему разработки рекомендательных систем. Так что проблема вполне себе актуальная для многих компаний и инженеров, которые вовлечены в разработку этих самых систем.
На сайте shikimori как раз реализована персональная система рекоммендаций на основании твоих оценок и оценок других пользователей. Жаль там только аниме/манга.

Во всем интернете ничего похожего не встречал (хотелось бы такой найти для фильмов), система работает отлично.
а я просто перестал смотреть фильмы вообще. все они повторяют то что уже было неоднократно снято и просмотрено тоже неоднократно. пересматриваю некоторые сериалы.
Мне кажется, что в статье сначала описана, а потом решена надуманная проблема.
В комментариях уже заметили, что реальная проблема заключается в невозможности точно определить заранее, будет ли лично вам интересен фильм (книга), даже если существуют многочисленные оценки от других зрителей и читателей.
Конечно, в этом нейросети могут нам помочь.
Но по понятным причинам (в первую очередь маркетингового свойства) созданы они не будут.
Но по понятным причинам (в первую очередь маркетингового свойства) созданы они не будут.
Они могут быть созданы как раз для этих причин. Как узнать, куда вложить не одну сотню миллионов, чтобы их потом вернуть? Это очень интересные возможности. Будет меньше провалов, но и не будет ничего прорывного. Ибо не каждый даже для себя понимает, что ему будет интересно.
Они могут быть созданы как раз для этих причин

На самом деле никому не нужно достоверное знание.
Историю Канторовича и идеального разреза листа помните?
На самом деле никому не нужно достоверное знание.
Ну, я бы за всех не расписывался.
Историю Канторовича и идеального разреза листа помните?
Чтобы помнить, нужно хотя бы знать. Не знаком.
Историю помним, тот факт что пруфов к ней нет тоже помним.
На самом деле никому не нужно достоверное знание.
Кстати, вот что пришло на ум. Типа достоверные данные не нужны, что что-то зачастили сообщения о том, что разные соц. сети и вендоры собирают очень много информации без ведома пользователя, что говорит как раз об обратном, что хотят знать всё и даже более. То есть предугадывать действия.
Рекомендации в Стим просто волшебны: мы рекомендовали вам игру «Симулятор девушка секс игрушки подземелье хентай» потому что вы играли в игры с тегом «женщина главная героиня» (Shadow of the Tomb Raider).
Я попытался бороться с этим методом «скрыть игру». В итоге у меня 5000 игр с пометкой «скрытая», а «ваш список рекомендаций» окончательно сошёл с ума. Из 100 игр он предлагает одну, которую не хочется скрыть в первую секунду. С каждым списком дно становится всё дальше и дальше, а я продолжаю погружаться. Если не вернусь, считайте меня программистом.
Давно перестал заходить в рекомендации стима, только в случае, если это нужно во время какого-то эвента типа распродажи. Потому как стим это давным давно свалка из огромной кучи не интересного мне инди и щепотки высокобюджетных проектов, про которые мне, как человеку, который следит за индустрией, и без того известно.

Та вроде все правильно рекомендут?;) Или вы играете ради головоломок?

Если то, что вы хотите сказать, не стоит поста — то и комментария это тоже не стоит. Если же вы хотите выразить поддержку или пожелать скорейшего появления следующих статей, то лучшим способом это сделать будет зайти на страницу доната

НЛП какое-то.
Что за жесть в статье? Вы не смогли написать систему рекомендаций и решили взглянуть на проблему более широко, через психологию и т.п.? Правильно, что пытаетесь копать, только системы рекомендаций прекрасно работают. Когда-то давно был имхонет, не с нейросетями, а с захардкоженными алгоритмами, которые помогали отыскать очень интересный контент. Сейчас рекомендации в Яндекс Музыке просто волшебны, из 20 треков 2-3 неизбежно попадают в коллекцию, остальные просто хорошие. Рекомандации похожих фильмов на Netflix и IVI работают вполне хорошо, но они рекомендуют по одной точке, если добавить хотя-бы две-три — точность будет в разы выше. Естественнно нужно учитывать настроение, а не просто подбирать на основе оценок пользователя, для этого есть свои решения. Другая частая проблема — ангажированность рекомендательных сервисов, которые проталкивают свой треш вместо нормального контента. Ну и конечно вкусы толпы, стоит один раз лайкнуть что-то попсовое как потом несколько дней похожий треш будет преследовать в рекомендациях, но это скорее потому, что системы пока сырые, научить их кластеризировать пользователей по мейнстримовости/андеграундовости простая инжинерная задача.
Есть более сложная задача — предсказание популярности нового контента, который пока имеет мало оценок, это действительно сложно. А общие рекомендательные системы — это давно и успешно решённая проблема.
Ответ на вопрос в заголовке, как только такая сложность возникает значит всё хорошие фильмы ты уже посмотрел. К сожалению это так, хотя фильмов в мире может быть и миллион хороших из них где то 1,5к-2к только.
ИИ — это нейросети (и многое другое), но, нейросети — это не ИИ. Почувствуйте разницу.
(подсказка: «каждая селёдка — рыба, но не каждая рыба — селёдка»)
То есть, в вашей аналогии «ИИ» = «рыба», а «нейросети» = «селёдка». Тогда ваш коммент выглядит так:
> Рыба — это селёдка (и многое другое), но, селёдка — это не рыба.

Почувствуйте глубину своего заблуждения.

Подсказка — это не аналогия (тем более, прямая). Это пример логики. Я же писал о том, что нейросети — только часть ИИ и не могут им полноценно считаться.

Не могут? Разве? А что же может?
Повторю автора: нейросеть — это НЕ система принятия решений. Кто и почему ни пытался бы сейчас называть её ИИ. Даже на термин «неполноценный ИИ» она не тянет. И тут я с ним полностью согласен. Если вы продолжите апеллировать к сформированным модой стереотипам, что «нейросеть = ИИ», то мы с вами тут не договоримся, т.к. не мы напрямую и указательно определяем рынку как эти понятия именовать и сопоставлять. Поэтому, я могу тут заявить и настаивать лишь на ошибочности такого знака "=".
> Повторю автора: нейросеть — это НЕ система принятия решений.
А ещё не алгоритм сортировки, не лампа и не косяк лебедей, улетающих на юг. Не система и не система. Я не понимаю почему вы пытаетесь спорить, что нейросети — один методов ИИ. Никто их не приравнивает, откуда вы это взяли?

Вы там выше про селёдку и рыбу говорили, в ваших терминах я не утверждаю, что «рыба = селёдка», я говорю «селёдка — рыба».
Винишко и лучшая подружка, круче чем нейросети и ИИ :-)
С одной стороны — вроде все логично. С другой стороны — причем тут система подбора фильмов? Поясню на нескольких примерах.

Пример 1 — человек хочет посмотреть какой-нибудь экшн
Реверс-инжиниринг:

намерение — посмотреть экшн;
ассоциирующаяся с ним эмоция — напряжение, адреналин
потребность в адреналине вызвана слишком спокойной жизнью;
решение — зарабатывать больше денег, что бы прыгать с парашютом, а не смотреть как это делают в фильме.

Пример 2 — человек хочет посмотреть романтику

намерение — переживание приятных романтичных моментов;
ассоциирующаяся с ним эмоция — влюбленность (ну наверное как то по другому, но простите, чукча не гуманитарий)
потребность во влюбленности вызвана слишком унылой жизнью;
решение — зарабатывать больше денег, что бы хватало на спонтанные романтические поступки.

Пример 3 — человек хочет посмотреть что-то под ужин

намерение — сменить стандартную обстановку за ужином (какой бы она ни была);
ассоциирующаяся с ним эмоция — зависит от исходной обстановки за ужином
потребность в этой эмоции вызвана слишком однообразной жизнью жизнью;
решение — разнообразить жизнь, и, думаю итак понятно что изначально для этого нужно.

Мораль — в подавляющем большинстве случаев, кино это дешевый/бесплатный способ убить время, отлично подходящий для кейсов когда отсутствие денег не позволяет выбрать лучшее развлечение, и глубокий анализ причин желания посмотреть фильм тут вообще не сдался.

Пример 4 — человек хочет посмотреть фильм ужасов
решение — зарабатывать меньше денег, чтобы превратить свою жизнь в гнетущий кошмар

провели за выбором столько времени, что на кино его не осталось


Я тоже пытался найти какую-то систему (трейлеры, отзывы, рейтинги и проч.).
Но столкнувшись примерно с теми же проблемами, что описаны в статье — стал использовать «метод случайного тыка».
И что удивительно, он оказался ничуть не хуже всех остальных подходов к решению данной проблемы.
(если попал на что-то «явно не то» — делаю еще одну попытку)
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
Sign up to leave a comment.

Articles