Комментарии / Профиль DSBTeam / Хабр

Пользователь

Как мы анализировали отзывы о мобильном приложении с помощью машинного обучения

DSBTeam 14 июл 2018 в 01:09

Andriljo спасибо за интересное предложение!
В принципе да, так тоже можно. Но мы решили, что предсказание непрерывной величины (значения нормы на дату) больше подходит для наших данных, чем бинарная классификация. Дело в том, что однозначно разметить аномалии можно только по явным пикам, которых значительно меньше условной «нормы». Т.о. мы получаем высокую несбалансированность обучающей выборки, где классу 1 соответствует на порядок меньше примеров, чем классу 0. Есть риск, что незначительные выбросы при таком обучении xgboost тоже загонит в 0, а они как раз очень ценны с т.з. раннего прогнозирования (как показано во втором примере).

Посмотреть

Как мы анализировали отзывы о мобильном приложении с помощью машинного обучения

DSBTeam 14 июл 2018 в 01:03

Посмотреть

Как мы анализировали отзывы о мобильном приложении с помощью машинного обучения

DSBTeam 13 июл 2018 в 16:26

Послали туда же куда и всегда — прорабатывать промышленное решение

Посмотреть

Как мы анализировали отзывы о мобильном приложении с помощью машинного обучения

DSBTeam 12 июл 2018 в 16:20

Ну почему же, как раз понятно :)
Спецпроекты в Сбербанк-Технологиях: как в банках готовят Hadoop, Spark, Kafka и прочую Big Data

Посмотреть