Как стать автором
Обновить

Машинное обучение своими руками (часть 2). Сервис для классификации обращений в тех. поддержку

Время на прочтение6 мин
Количество просмотров11K
Всего голосов 14: ↑13 и ↓1+12
Комментарии5

Комментарии 5

Я наверное придираюсь, но где пример запуска? где пример вывода? Зачем вам отдельная функция для приведения к нижнему регистру?
Почему бы не добавить определение кодировки консоли?
В заголовке речь о телеграм-боте — в примерах им и не пахнет)
Иван, скрипт можно запустить из консоли. Но какой смысл, например, размещать скриншот или текст выполнения скрипта (хотя, может быть, я вас не понял). В любом случае вот пруф, что все работает: prntscr.com/hd80m6 :)

На счет приведения к нижнему регистру, согласен. В первой части немного раскрывается подробнее, что я 10 лет занимался совсем не программированием (и сейчас не занимаюсь), поэтому культура кода вероятно не дотягивает до лучших образцов. Мог бы в своей оправдание сказать, что отдельная функция нужна была в 1 части, т.к. мы предварительно фильтровали слова по признакам «мусорных», но и там можно бы было избавиться.

В заголовке кстати нет ничего про Телеграм-бота, просто изначально статья планировалась про него (и на хакатоне мы его запилили с учетом ML), но подумали, что никому про бота читать не будет интересно. А вот как сделать применимый сервис классификации заявок (вне зависимости от того, приходят они из бота или по почте) — читать интереснее (мы так думаем :).
про бота извиняюсь — заголовок прочитал вскользь до картинки).

Смысл в скриншоте или тексте вывода есть всегда. Это придаст законченность вашему скрипту.
Какая метрика использовалась для оценки алгоритма? Какие результат достигнуты?
P.S. Привет землякам.
Роман, и вам привет!
О метриках было рассказано в первой части статьи: взяли точность, так как распределение категорий заявок более-менее равномерное. На 14 категориях при обучающей выборке из 1200 заявок лучший алгоритм показал 73,5%.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий