Как стать автором
Обновить

Чем гибридные системы распознавания речи лучше End-to-End решений

Время на прочтение4 мин
Количество просмотров3.2K
Всего голосов 7: ↑6 и ↓1+7
Комментарии3

Комментарии 3

Я помню готовился к сдаче экзамена по Английскому еще давно в начале 2000х, используя механизм обучения программы распознавания речи: читал в микрофон предложения с экрана на английском и программа указывала что распознала, а что нет. В результате я научился говорить правильно и сдал экзамен хорошо, а научилась ли чему-то программа до сих пор не знаю)

Тот же Wav2Vec2.0 обученный на англ, можно дообучить на других языках. При этом достаточно 10+ часов. И времени не много требует, на том же Colabe можно сделать.

Да, но для этого нужно иметь качественно размеченные 10+ часов (а чтобы хорошо работало - сильно больше). Классическую архитектуру можно адаптировать под клиента имея только тексты. Но скорее всего архитектуры подобные Wav2Vec2.0 скоро окончательно победят гибриды.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий