usmetanina 21 окт 2019 в 08:25

Как Мефодий стал Анной: опыт разработки и запуска классификаторов голосовых сообщений. Часть 1

5 мин

1.6K

Голосовые интерфейсы*Искусственный интеллектМашинное обучение*

Из песочницы

+10

Комментарии 4

CrazyElf 21 окт 2019 в 09:28

Хотелось бы увидеть ещё скорость обучения и предсказания для разных моделей. Там на порядки может быть разница. И очень круто, что LR хорошо взлетела — значит, фичи хорошо подготовили, респект. :) LR быстрая и хорошо интерпретируемая, простые модели когда взлетают — это по всему хорошо.
Кстати, по моему опыту, из лесов на текстах хорошо взлетал почему-то ExtraTrees. TF-IDF у меня почти не давал прибавки над простым Bag Of Words. И NB бывает как минимум двух видов — Gaussian и Multinomial, надо оба пробовать на всякий случай.

usmetanina 27 окт 2019 в 16:38

Полностью согласна, не зря говорят, чем проще, тем лучше, а в итоге оказывается ещё и быстрее, и интерпретируемее :)
Добавлю в следующем посте про скорость обучения, спасибо

Alado 27 окт 2019 в 16:25

Можно было сэкономить массу сил и денег.
NLP завести на DeepPavlov, буквально в одну строчку, а распознавание речи на Kaldi-asr с моделью Николая Шмырева. И не нужно никому ничего платить, а сэкономленные деньги лучше отправьте авторам этих продуктов.
Все инструменты распространяются под лицензией Apache 2.0.
Я сам использую эти инструменты для создания чат-ботов. По сути, решаю те же задачи, распознавания речи и классификации текстов.

usmetanina 27 окт 2019 в 16:32

Знакомы с DeepPavlov очень близко, суть в том, что на момент нашей разработки (год назад) этот инструмент был слишком сырым. Насчёт распознавания речи, тут всё зависит от домена, для нас было критично качество распознавания, даже свои модели обучали под нашу предметную область, так что использовать что-то готовое не всегда возможно. Но инструменты названы крутые, не спорю)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий