Комментарии 70
RIP кинобаза, RIP имхонет.
По GDPA сервисы должны предоставлять выгрузку всей накопленной о юзере информации, т.е. его оценки в том числе.
И залить эти выгрузки в любом случае было (и есть) некуда.
Потом имхонет закрылся, потому что у его владельца был так же строительный бизнес, на котором он и решил сконцентрироваться. Потом пошла волна, «не покупайте у него недвижку, он вас в любой момент может кинуть как с имхонетом».
После этого появилась возможность выгрузки оценок, чем я сразу же воспользовался, у меня их было около 700.
Потом Кинопоиск добавил возможно импорта оценок из имхонет. Чем я тоже воспользовался, но кинопоиск мне так ничего и не порекомендовал, писал «Недостаточно оценок, оцените фильмы из топ-500» и это при наличии 700 оценок.
В imdb был только экспорт, я вручную проставил оценки для фильмов, которые я оценивал на 9-10, но никаких внятных рекомендаций так и не получил.
Короче с тех пор я не пользуюсь рекомендательными системами и выбирать фильмы стало сильно сложнее.
А всё могло сложиться иначе, если бы все оценки за 10 лет выложили в общий доступ без привязки к персональной информации, тогда мог бы появиться новый рекомендательный сервис.
PS: строительная контора, в пользу которой был закрыт имхонет, в итоге обанкротилась, а владелец свалил заграницу :)
Надо чтобы рекомендательный сервис принимал список просмотренного кино, даты просмотра и его оценки.
2. Эксперт продаётся диснею/марвелу/…
3. Смотрим одни комиксы.
Реальная история.
Зритель ищет в кино определенную гамму эмоций, соответствующую текущему настроению и ситуации. Думаю алгоритмы можно улучшить, если зайти с этой стороны.
Короче, нейросети нам не помогут, потому что наше подсознание — тоже нейросеть.
А в чем противоречие? Есть большая сложная нейросеть А в голове конкретного зрителя, есть маленькая простенькая сеть Б на сервере рекомендательной системы. Сеть Б это упрощенная модель сети А, которая должна давать максимально близкий выход к выходу сети А, вход — это информация о конкретном фильме + шум, неизвестный сети Б (эмоции и потребности в момент просчета выхода сети А). Выход — это некая метрика (чем выше, тем больше понравился фильм).
Глубинные слои (гиперпараметры) сети Б обучаются по большому датасету на много зрителей. Параметры сети Б обучаются по действиям конкретного зрителя.
Понятно, что если можно было бы просчитать А на всех фильмах в БД, то Б не нужна. Так же выходит, что мы выбираем между двумя неидеальными вариантами.
1) запускать классную сеть А на малом наборе данных (фильмах, о которых может прочитать зритель)
2) запускать сеть Б на полном наборе данных (фильмы всех времен и народов).
Вполне может быть, что вариант 2 покажет результат лучше за счет большей выборки.
Условно, если 10% фильмов конкретному зрителю заходит, то выбрать 1, прочитав о 10, это сложная задача, ведь этот 1 фильм может в эти 10 и не попасть. А вот выбрать 1 из 20000, который попадет в топ 2000 конкретного зрителя — задача намного проще
Когда-то я хотел купить зонтик. За пару дней изучения вопроса я выбрал модель и продавца. И купил зонтик. Потом ещё несколько дней гугл и фейсбук мне навязывали рекламу зонтиков, хотя эта тема для меня была уже совершенно не актуальна.
Рекомендательные системы не так же работают? Они просто дают то, что мне нужно было в прошлом. Конечно, если кто-то очень любит именно "зонтики", то это было бы очень удобно…
Ваще ниачём. Сотрите вам память и вы броситесь смотреть все хитовые вещи последних 40 лет. Проблема в том, что вы просто закушались и уже знаете "о чем фильм" даже если его ещё не смотрели, сюжеты-то похожи. Всё реже и реже среди новинок появляется что-то, что вас цепляет уже по трейлеру — это растёт ваш опыт, ваше знание сюжетов. Это нормальный процесс. Изучай списки где снялись любимые актеры — можно не из-за сюжета смотреть, а из-за актера. Когда и это наскучит, иди лучше творить — софт, музыку, книги писать, статьи и т.п., или в реале — ремонт, стройка, спорт...
Например, после " Экспансии" я не могу смотреть драных «Килджоев», хотя поначалу нравились. Лучшее враг хорошего.
Сейчас правда забросил, т.к. не нашел простой выход на монетизацию.
В рекомендательных системах не хватает опции "тебе не нужен фильм, тебе нужно Х". Как только расширится набор рекомендаций и он будет корректироваться под текущую активность пользователя, всё сложится.
Лента Фейсбука работает близко к общей рекомендательной системе. Фейсбук знает лучше, что вам понравится именно сейчас.
Не нужно тешить себя чувством уникальности, базовые потребности у всех одинаковые, их ограниченное количество, важно просто накопить статистику по лично вам в широком круге рекомендаций и система будет успешно предсказывать то, что даст вам удовлетворение и/или удовлетворение рекламодателю именно сейчас.
Айван Лок — примерный семьянин и успешный руководитель строительства. Завтрашний день — один из важнейших в его жизни, его ждет карьерный рост. Но вечером раздается телефонный звонок, который перевернет его жизнь с ног на голову.Как именно перевернет? Это будет драйвовый боевик или же психологический триллер? Из описания ничего не понятно.
Тайлер — беспечный студент, который никак не может найти общий язык с окружающим миром. Он подавлен смертью старшего брата. Отцу, как, впрочем, и матери с отчимом, нет до него никакого дела. К счастью, у него есть друг Эйдан. Однажды парни случайно ввязываются в уличную драку…Вот еще пример. Опять ничего не понятно. Все так боятся спойлеров что описания превращаются в скукоту которая не описывает фильм от слова совсем.
Айвен Лок (Том Харди) работает прорабом. Завтрашний день — один из важнейших в его жизни, его ждет карьерный рост. Но вечером раздается телефонный звонок, который перевернет его жизнь с ног на голову. Накануне важнейшего события на стройке он вынужден ехать в Лондон ночью, чтобы присутствовать при родах внебрачного ребёнка от женщины Бетан, которую он толком и не знает. Измену ему предстоит раскрыть жене Катрине, от которой у него двое детей.
Также, его мучают простуда и начальник Гарет, а свою работу ему приходится доверить неопытному Доналу. Он продолжает бороться с проблемами в работе и личной жизни, сидя в салоне движущегося автомобиля весь фильм, принимая и совершая звонки. В финале зритель будет вознаграждён — главный герой приедет к месту назначения, и впервые камера выйдет за пределы внутреннего пространства авто, в «большой мир».
И кстати говоря, это называется синопсис, а не описание, синопсис не должен описывать фильм или рассказывать сюжет.
С другой стороны смотреть то нечего. Некоторые корейские дорамы будут получше распиаренного фильма с бюджетом в несколько сот лимонов. Те же фильмы DC (я ни в коем разе не хочу обидеть фанатов) отличаются просто детской мотивацией персонажей, как это можно смотреть? На их фоне какойнить судья дред уже просто шедевр глубины мысли)
ЗЫ я для себя проблему решил просто SG-1, SGA, SGU, House M. D., Mentalist, Fringe, Fairy Tail по кругу)
С другой стороны смотреть то нечего. Некоторые корейские дорамы будут получше распиаренного фильма с бюджетом в несколько сот лимонов.
Во втором предложении вы предлагаете решение проблемы, обозначенной в первом. Расширяйте свои границы, есть сотни очень хороших фильмов, которые просто не представлены в массовой культуре.
Почему-то в статье не поднимается вопрос рекомендации для мужа и жены, у которых разные интересы.
Для одного человека, если он конечно работает, и не сторожом, вопрос выбора что посмотреть не стоит, наоборот времени нет
Лично у меня проблема диаметрально противоположная — я точно знаю, что хочу, и посмотрел так много фильмов, что их уже не осталось.
В целом проблема вообще странная, вроде как на хабре собирается народ которому есть чем заняться.
Во всем интернете ничего похожего не встречал (хотелось бы такой найти для фильмов), система работает отлично.
В комментариях уже заметили, что реальная проблема заключается в невозможности точно определить заранее, будет ли лично вам интересен фильм (книга), даже если существуют многочисленные оценки от других зрителей и читателей.
Конечно, в этом нейросети могут нам помочь.
Но по понятным причинам (в первую очередь маркетингового свойства) созданы они не будут.
Но по понятным причинам (в первую очередь маркетингового свойства) созданы они не будут.Они могут быть созданы как раз для этих причин. Как узнать, куда вложить не одну сотню миллионов, чтобы их потом вернуть? Это очень интересные возможности. Будет меньше провалов, но и не будет ничего прорывного. Ибо не каждый даже для себя понимает, что ему будет интересно.
Они могут быть созданы как раз для этих причин
На самом деле никому не нужно достоверное знание.
Историю Канторовича и идеального разреза листа помните?
На самом деле никому не нужно достоверное знание.Ну, я бы за всех не расписывался.
Историю Канторовича и идеального разреза листа помните?Чтобы помнить, нужно хотя бы знать. Не знаком.
На самом деле никому не нужно достоверное знание.Кстати, вот что пришло на ум. Типа достоверные данные не нужны, что что-то зачастили сообщения о том, что разные соц. сети и вендоры собирают очень много информации без ведома пользователя, что говорит как раз об обратном, что хотят знать всё и даже более. То есть предугадывать действия.
Я попытался бороться с этим методом «скрыть игру». В итоге у меня 5000 игр с пометкой «скрытая», а «ваш список рекомендаций» окончательно сошёл с ума. Из 100 игр он предлагает одну, которую не хочется скрыть в первую секунду. С каждым списком дно становится всё дальше и дальше, а я продолжаю погружаться. Если не вернусь, считайте меня программистом.
Та вроде все правильно рекомендут?;) Или вы играете ради головоломок?
Если то, что вы хотите сказать, не стоит поста — то и комментария это тоже не стоит. Если же вы хотите выразить поддержку или пожелать скорейшего появления следующих статей, то лучшим способом это сделать будет зайти на страницу доната
НЛП какое-то.
Есть более сложная задача — предсказание популярности нового контента, который пока имеет мало оценок, это действительно сложно. А общие рекомендательные системы — это давно и успешно решённая проблема.

(подсказка: «каждая селёдка — рыба, но не каждая рыба — селёдка»)
> Рыба — это селёдка (и многое другое), но, селёдка — это не рыба.
Почувствуйте глубину своего заблуждения.
Подсказка — это не аналогия (тем более, прямая). Это пример логики. Я же писал о том, что нейросети — только часть ИИ и не могут им полноценно считаться.
А ещё не алгоритм сортировки, не лампа и не косяк лебедей, улетающих на юг. Не система и не система. Я не понимаю почему вы пытаетесь спорить, что нейросети — один методов ИИ. Никто их не приравнивает, откуда вы это взяли?
Вы там выше про селёдку и рыбу говорили, в ваших терминах я не утверждаю, что «рыба = селёдка», я говорю «селёдка — рыба».
Пример 1 — человек хочет посмотреть какой-нибудь экшн
Реверс-инжиниринг:
намерение — посмотреть экшн;
ассоциирующаяся с ним эмоция — напряжение, адреналин
потребность в адреналине вызвана слишком спокойной жизнью;
решение — зарабатывать больше денег, что бы прыгать с парашютом, а не смотреть как это делают в фильме.
Пример 2 — человек хочет посмотреть романтику
намерение — переживание приятных романтичных моментов;
ассоциирующаяся с ним эмоция — влюбленность (ну наверное как то по другому, но простите, чукча не гуманитарий)
потребность во влюбленности вызвана слишком унылой жизнью;
решение — зарабатывать больше денег, что бы хватало на спонтанные романтические поступки.
Пример 3 — человек хочет посмотреть что-то под ужин
намерение — сменить стандартную обстановку за ужином (какой бы она ни была);
ассоциирующаяся с ним эмоция — зависит от исходной обстановки за ужином
потребность в этой эмоции вызвана слишком однообразной жизнью жизнью;
решение — разнообразить жизнь, и, думаю итак понятно что изначально для этого нужно.
Мораль — в подавляющем большинстве случаев, кино это дешевый/бесплатный способ убить время, отлично подходящий для кейсов когда отсутствие денег не позволяет выбрать лучшее развлечение, и глубокий анализ причин желания посмотреть фильм тут вообще не сдался.
провели за выбором столько времени, что на кино его не осталось
Я тоже пытался найти какую-то систему (трейлеры, отзывы, рейтинги и проч.).
Но столкнувшись примерно с теми же проблемами, что описаны в статье — стал использовать «метод случайного тыка».
И что удивительно, он оказался ничуть не хуже всех остальных подходов к решению данной проблемы.
(если попал на что-то «явно не то» — делаю еще одну попытку)

Почему так сложно выбрать, какое кино посмотреть (и нейросети эту проблему не решат)