snikolenko 16 июл 2014 в 19:52

Вероятностные модели: LDA, часть 2

6 мин

23K

Блог компании SurfingbirdМатематика*

+23

Комментарии 7

hombre 16 июл 2014 в 23:41

Спасибо, интересное изложение «крупными мазками».

я бы добавил ещё мазок про то, что такое «сопряжённым априорным распределением», что апостериорное распределение принадлежит тому же классу, что и априорное распределение, т.е. после ~~всех махинаций~~ оценки модели, мы находим оценки искомых параметров, через новые параметры, при этом и априорное и апостериорные распределения оказываются, что принадлежать одному и тому же классу (впрочем у вас лучше получается объяснять)

snikolenko 16 июл 2014 в 23:54

Да, про сопряжённые априорные из этого текста не должно было быть понятно. :)
Про них надо отдельно говорить при случае, начиная с монетки.

zz_wolf 17 июл 2014 в 13:12

Шикарно — спасибо!

iHun 16 дек 2014 в 08:48

Спасибо за ваши статьи! Лучшие материалы по данной теме на русском языке.
Подскажите пожалуйста, как можно решить вопрос о количестве тем? Насколько я знаю, MALLET определяет оптимальное количество тем ещё на этапе конструирования модели, но я использую gensim. Да и вообще интересно, какие варианты существуют?

snikolenko 16 дек 2014 в 10:04

Лично я обычно на глаз подбираю. :)

Вообще существует отдельное большое направление, связанное с непараметрическими байесовскими методами. Ключевые слова — Dirichlet processes, например, Chinese restaurant process. Там получается модель (в том числе и LDA получается), которая сама подбирает число тем. Надо будет как-нибудь реализовать и попробовать это физически.

iHun 16 дек 2014 в 14:59

Это называется «экспертная оценка») Но для диплома мне надо что-нибудь более убедительное)
Как я понял, два других метода — это перплексия и на основе расстояния Кульбака — Лейблера. На второе мне не хватает памяти, так что займусь первым, тем более что в gensim для этого есть инструменты.

snikolenko 16 дек 2014 в 15:45

perplexity с ростом числа тем будет, скорее всего, монотонно меняться, это же как правдоподобие фактически

тут нужен метод model selection вроде BIC/AIC скорее

Зарегистрируйтесь на Хабре, чтобы оставить комментарий