Как стать автором
Обновить

Комментарии 8

Поэтому оптимальным представляется комбинация этих двух методов.
Это ещё раз подтверждает, что data mining — это искусство. Алгоритм не дает больше, чем представлено в тех или иных данных. Это всего лишь способ автоматизации. Реальный профит в знаниий того как скомбинировать алгоритмы и как структурировать предметную область.
Да, здесь я с вами согласен. А о том, как можно комбинировать алгоритмы, я думаю, мы еще расскажем…
А это и есть Natural Language Processing?
Скажем так — это небольшая подзадача этой обширной области знаний. NLP — это как компьютерный анализ естественного языка, так и синтез, то есть генерация текста. У нас же только анализ и то в достаточно узкой постановке задачи — выявить тематические топики веб-страниц и составить рекомендации для сёрфа.
А можно данные с результатами в rmse?
В силу специфики нашей задачи, для оценки качества мы использовали другие метрики NDCG, AUC, MAP, WTA и т.д. Поэтому по RMSE, увы, не могу…
А что такое WTA?
Вообще, про метрики было бы интересно отдельно почитать.
WTA=winner takes all, то есть метрика, заточенная на одну, самую релевантную рекомендацию
Зарегистрируйтесь на Хабре, чтобы оставить комментарий