Как стать автором
Обновить

Как Мефодий стал Анной: опыт разработки и запуска классификаторов голосовых сообщений. Часть 1

Время на прочтение 5 мин
Количество просмотров 1.5K
Всего голосов 14: ↑12 и ↓2 +10
Комментарии 4

Комментарии 4

Хотелось бы увидеть ещё скорость обучения и предсказания для разных моделей. Там на порядки может быть разница. И очень круто, что LR хорошо взлетела — значит, фичи хорошо подготовили, респект. :) LR быстрая и хорошо интерпретируемая, простые модели когда взлетают — это по всему хорошо.
Кстати, по моему опыту, из лесов на текстах хорошо взлетал почему-то ExtraTrees. TF-IDF у меня почти не давал прибавки над простым Bag Of Words. И NB бывает как минимум двух видов — Gaussian и Multinomial, надо оба пробовать на всякий случай.
Полностью согласна, не зря говорят, чем проще, тем лучше, а в итоге оказывается ещё и быстрее, и интерпретируемее :)
Добавлю в следующем посте про скорость обучения, спасибо
Можно было сэкономить массу сил и денег.
NLP завести на DeepPavlov, буквально в одну строчку, а распознавание речи на Kaldi-asr с моделью Николая Шмырева. И не нужно никому ничего платить, а сэкономленные деньги лучше отправьте авторам этих продуктов.
Все инструменты распространяются под лицензией Apache 2.0.
Я сам использую эти инструменты для создания чат-ботов. По сути, решаю те же задачи, распознавания речи и классификации текстов.
Знакомы с DeepPavlov очень близко, суть в том, что на момент нашей разработки (год назад) этот инструмент был слишком сырым. Насчёт распознавания речи, тут всё зависит от домена, для нас было критично качество распознавания, даже свои модели обучали под нашу предметную область, так что использовать что-то готовое не всегда возможно. Но инструменты названы крутые, не спорю)
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории