Comments / Profile of snikolenko / Habr

How to become an author

Сергей Николенко @snikolenko

User

Profile Publications 20Comments 112Bookmarks 2

Многорукие бандиты: введение и алгоритм UCB1

snikolenko Feb 9 2013 at 00:06

Т.е., отвечая совсем конкретно на ваш вопрос, если все ручки примерно одинаковые, то большой разницы между m1 и m2 не будет. А если одна ручка заметно лучше других, то m2 будет заметно меньше m1.

0

Многорукие бандиты: введение и алгоритм UCB1

snikolenko Feb 9 2013 at 00:05

Можно, но это зависит от соотношений между ручками. Собственно, теорема Auer et al. заключается в том, что regret получится логарифмический, причём порядок величины там \sum_{неоптимальные ручки} ln(n) / Delta_i, где Delta_i — разница в ожиданиях выигрышей между i-й ручкой и оптимальной. Простыми словами это значит довольно естественную вещь: чем сильнее оптимальная ручка выделяется на фоне остальных, тем меньше будет regret (тем быстрее мы найдём оптимальную), причём зависимость будет буквально обратно пропорциональная.

0

Многорукие бандиты: введение и алгоритм UCB1

snikolenko Feb 8 2013 at 23:21

Так не надо останавливаться. :) Идёт поток, и пусть идёт. Со временем, естественно, наступит сходимость и выбор ручки будет меняться всё реже и реже.

0

LISP-интерпретатор на чистом C

snikolenko Sep 4 2012 at 21:34

Извините, не удержался – какой чистый и незамутнённый пример десятого правила Гринспена. :)

+7

Рекомендательные системы: LDA

snikolenko Sep 2 2012 at 21:03

Так, может, действительно out? Я, честно говоря, не могу с ходу сообразить, какое должно быть потребление – понятно, что минимум число топиков умножить на число документов плюс число слов, но это минимум…

0

Рекомендательные системы: LDA

snikolenko Sep 1 2012 at 07:43

Это не удивительно, но хорошо. :)

Хабр большой, мы рекомендуем страницы, а не сайты. Например, вот эта статья попала в компанию к этой и этой. А вот эта – к совсем другим. Но в основном более технические группы, конечно.

0

Рекомендательные системы: теорема Байеса и наивный байесовский классификатор

snikolenko Aug 29 2012 at 22:07

Это задумывалось как цикл статей по рекомендательным системам. Эта конкретная запись пообщее вышла, но я надеюсь уже в следующей части вернуться к теме.

0

Рекомендательные системы: теорема Байеса и наивный байесовский классификатор

snikolenko Aug 28 2012 at 12:00

Я бы обязательно написал отличный текст про распознавание сарказма, если бы что-нибудь в этом понимал и если бы это было по теме блога. ;)

0

Рекомендательные системы: теорема Байеса и наивный байесовский классификатор

snikolenko Aug 27 2012 at 06:59

Некоторые предложения про наивный байес прямо из моих лекций взяты; про саму теорему я тоже не в первый раз пишу, не исключено, что начинаю повторяться. :)

0

Рекомендательные системы: оверфиттинг и регуляризация

snikolenko May 11 2012 at 19:42

Рад, что интересно!

(1) Конечно, изучали. Это отдельный интересный вопрос: главный урок Netflix Prize — в том, как объединять кучу разных моделей в одну рекомендацию; когда-нибудь и до него дойдём.
(2) Боюсь, секрет. :)

0

Рекомендательные системы: оверфиттинг и регуляризация

snikolenko May 11 2012 at 18:48

(1) Изучали, конечно. Это отдельная интересная тема – как совместить несколько алгоритмов.
(2) Боюсь, секрет. :)

0

Рекомендательные системы: оверфиттинг и регуляризация

snikolenko May 11 2012 at 16:03

Я пока могу просто ссылку дать: graphlab.org
Там есть прямо примеры кода сильно параллельных рекомендательных систем.
Подробно пока руки не дошли описывать, но когда-нибудь текст о рекомендациях на графлабе обязательно будет.

0

Рекомендательные системы: оверфиттинг и регуляризация

snikolenko May 11 2012 at 14:40

Как следует из предисловия к этому тексту, заметил. :)
И именно поэтому собираюсь писать более общо и концептуально.

0

Рекомендательные системы: оверфиттинг и регуляризация

snikolenko May 11 2012 at 14:27

Да, ну так ведь предыдущий скрипт так и делает: кушает данные в формате
<id пользователя>; <id продукта>; <оценка>
и выдаёт ответ в виде
<id пользователя>; <список факторов>
и
<id продукта>; <список факторов>
Чтобы затем сделать рекомендацию, нужно взять вектор факторов пользователя и умножить его скалярно на вектор факторов продукта (и даже это, кажется, в скрипте тоже было). Обращение к базам данных, каюсь, не вписывал, но это уж совсем не по теме.

Спасибо за отличные вопросы! На них, безусловно, ответы уже существуют. :) Например, особенно интересный вопрос – про «только что пришедших», особенно если его чуть обобщить: пользователь пришёл на сайт, сделал двадцать лайков и хочет, чтобы что-нибудь тут же изменилось, а пересчёт запланирован на завтра. Это так называемые онлайн-рекомендации, алгоритмы есть, постараюсь про них рассказать. Но вообще я планировал переходить к частностям чуть позже, когда разберусь с концептуальными вопросами – уже шесть статей было, а я ещё, чёрт возьми, про теорему Байеса не рассказал. :)

0

Рекомендательные системы: оверфиттинг и регуляризация

snikolenko May 11 2012 at 14:11

P.S. Кстати, я пока поддерживал оглавление на своей страничке:
logic.pdmi.ras.ru/~sergey/index.php?page=popular
хотя это, конечно, тоже трудно назвать хорошей рекламой. :)

0

Рекомендательные системы: оверфиттинг и регуляризация

snikolenko May 11 2012 at 14:10

Оглавление – это отличная мысль! Вы не знаете, на хабре можно сделать заглавный пост, который будет всегда висеть сверху?

Про практическое применение не очень понял – то есть я вроде бы стараюсь, даже вот работающий код запостил. Понятно, конечно, что я не могу для каких-то неизвестных мне проектов конкретные решения предлагать, а могу только объяснять общую механику происходящего. Но вот код, который был в прошлый раз, действительно лёг в основу одной из стратегий, которые реально работают в surfingbird (там, конечно, в production код слегка посложнее :), но по сути именно такой).

На случай большого количества данных – вообще-то это и есть алгоритмы для большого количества данных. :) Вряд ли у вас база рейтингов больше, чем у Netflix и Amazon. Разложение матриц – алгоритм как раз для того, чтобы от O(M*N) перейти к O(M+N); про скорость сходимости так сразу с ходу не скажу, надо посмотреть, но в любом случае вероятностное разложение матриц хорошо параллелизуется – когда-нибудь обязательно расскажу о параллельной реализации на GraphLab. Так что да, именно эти алгоритмы и работают для больших массивов данных, и именно их и надо реализовывать в первую очередь.

0

Рекомендательные системы: оверфиттинг и регуляризация

snikolenko May 11 2012 at 13:14

Эх, надо тогда как-то шире рекламировать, а то потомки не забудут потому, что не узнают никогда. :)

Да, тот самый.

0

Рекомендательные системы: SVD и базовые предикторы

snikolenko Apr 12 2012 at 19:31

Да, это верно, это я зря перепутал.

0

Рекомендательные системы: SVD и базовые предикторы

snikolenko Mar 30 2012 at 13:08

В основном только статьи; статей очень много, они легко гуглятся по «SVD in collaborative filtering». Какого-то единого объемлющего текста пока не видел – может быть, я в итоге напишу какое-то к нему приближение (не здесь, а в виде единого текста).

0

Рекомендательные системы: SVD, часть I

snikolenko Mar 16 2012 at 13:06

Обычно – RMSE (root mean squared error). Если придётся к слову, мы обязательно поговорим об этом как-нибудь.

0

5