Обновить

Комментарии 25

Статья хорошая, безусловно, но не могли бы вы исправить некоторые ошибки? Перечитайте повнимательней.
был бы признателен, если бы указали конкретные места, которые, по Вашему мнению, стоит переработать
Я не буквоед, но из-за этих ошибок пришлось абзац три раза перечитать чтобы понять:)
2й абзац - "...любой, кто изобретает алгоритмА.."
- "...количеством доступнОМ для анализа информации.."
- "...достигнут некоторый прогреАсс.."
- "...скорее, вопросом преставления.." (наверное все-таки преДставления:)
- не буду перечислять еще что-то потому что вы сами должны были это сделать перед тем как постить.
Александр, я уважаю Ваш труд, но считаю недопустимым указывать, что я должен был сделать перед публикацией
Не обижайтесь, я из хороших побуждений (да и кто я такой, чтобы Вам указывать:).
да я внес уже все правки, чуть еще подправил, it's OK :)
Веселые времена настанут тогда, когда эти рекомендательные системы станут на столько хороши и популярны, что фильмы начнут снимать под них.
А что в этом плохого, собственно говоря? Наверняка сценаристы в Голливуде уже давно имеют набор штампов, которые нравятся публике. На самом деле, интересное начнется тогда, когда фильмы станут интерактивными.
в шоубизнесе будут создаваться аналоги дорвеев
они и так уже давным давно есть
Я лично использую рекомендательный сервис imhonet. Должен сказать, он бывает ошибается, однако в большинстве случаев предугадывает довольно верно.
Alex Iskold прежде всего знаменит своими статьями о семантике, у него и компания на этом специализируется. Очень хорошие у него статьи, популярные такие, то есть легкие, потому с удовольствием читаю.
Это что - машинный перевод?
Если не брать в расчет фильмы и новости, где было бы хорошо применить вышеописанные фильтры?

Их можно применять там же, где сейчас уже применяют рекомендации, например, в музыке. В Imhonet ещё есть разделы, посвящённые книгам, сцене, комп. играм.
Можно ещё к кафе/ресторанам.
Фильтры и рекомендации можно применять вообще ко всем вещам, которые можно сравнивать и выбирать.
livelib.ru Рекомендует книги. Пока доволен, книги куда медленнее читаются поэтому навреное дольше буду доволен.
> Ошибочные результаты расстраиваются, а неверные ошибки нет.

Не совсем понял про фильтры, что имеется ввиду? Например, на Озоне имеется кнопка, по нажатию на которую мы говорим, что нам не понравилась рекомендация.
А что значит одна большая кнопка для фильтрации?

К сожалению, в статье практически не раскрыта тема успешных алгоритмов конкурса Netflix, так чтобы мы смогли применить их на практике.
Первая цитата приведена как лишенная смысла :) Наверное, там утеряно "из-за"
ОЗОН как раз предлагает "то, что тебе должно понравиться". При этом позволяет настроить рекомендации вручную. Таким образом пытаются уменьшить риск того, что в статье названо "ошибочный результат".

Тема про "неверные ошибки" — это, как японял, не выбор "хороших" сущностей, а удаление "плохих". В общем-то спам фильтры работают по такому принципу. Считаем, что нам страшнее плохое назвать хорошим чем не назвать хорошее хорошим. В статитсике это ошибки 1го и 2го рода (никогда не мог запомнить что из них что).

Мне, как раз, очень понравилась эта идея. Новая для меня мысль в плане рекомендательных систем.
А, спасибо, теперь понял. Интересная идея. Только вот она мне кажется затратной с точки зрения рассчетов. Если для писем понятны параметры для оценки (текст, отправитель и т.д.), то какие параметры у рекомендательной системы? Искать максимально непохожих на данного пользователя пользователя и вычеркивать его предпочтения?
Идея частично в статье была: из множества киноновинок отсечь заведомо мне неинтересные. Понять, что мне НЕ интересны низкобюджетные ужастики, тупые молодежные комедии и все фильмы с Вином Дизелем (все для примера) — задача сопостовимая с определением интересных фильмов. Тут вся выборка сущностей достаточно маленькая. Мне бы лично такой сервис был бы интересн...

С другой стороны, я, работая с рекомендательными системами пришел к выводу, что это больше для лонг-тейла, чем для новинок. Т.е. интересно выудить достаточно старую сущность (здесь скорее о книгах), которя ускользнула от взгляда. По таким объектам информации уже много — пространство для работы есть. На новинках статистику еще рано пременять.
Да в принципе все рек. системы для лонгтейла, а новое учитывать - это уже дополнительное измерение надо вводить - время.

Заведомо неинтересные? Но тогда и пользователя нужно отправлять не на оценку прочитанных книг, а того, что ему не нравится?
>> Но тогда и пользователя нужно отправлять не на оценку прочитанных книг, а того, что ему не нравится?

Ну почему же?! Юзер идет на список новинок, видит большой список. Нажимет кнопку "убрать неинтересные" и список существенно сокращается. Почему это лучше, чем вывести список понравившихся — (см. статью) психология потребителя.

Повторюсь, что это хорошо на сравнительно небольшом списке объектов. Даже больше: если до удаление "мусора" список необозримо большой, а после — вполне доступен для беглого просмотра, то наша модель заработала!
> Юзер идет на список новинок, видит большой список. Нажимет кнопку "убрать неинтересные" и список существенно сокращается.
Это понятно, это уже следствие алгоритма. А сам алгоритм? Из чего он будет получать информацию о том, что есть потенциальный "спам"?
Нужны неоторые события, характеризующие негативное отношение к товару. Например, плохая оценка товара, плохой отзыв, малое время просмотра (это уже сложно и экзотично). А дальше все аналогично поиску положительных рекомендаций (тут масса вариантов). "Товар не нравиться похожим на меня людям => не понравиться мне"
Хм, довольно интересный подход. Задумался.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации