Обновить

Чем гибридные системы распознавания речи лучше End-to-End решений

Время на прочтение4 мин
Охват и читатели4.4K
Всего голосов 7: ↑6 и ↓1+7
Комментарии3

Комментарии 3

Я помню готовился к сдаче экзамена по Английскому еще давно в начале 2000х, используя механизм обучения программы распознавания речи: читал в микрофон предложения с экрана на английском и программа указывала что распознала, а что нет. В результате я научился говорить правильно и сдал экзамен хорошо, а научилась ли чему-то программа до сих пор не знаю)

Тот же Wav2Vec2.0 обученный на англ, можно дообучить на других языках. При этом достаточно 10+ часов. И времени не много требует, на том же Colabe можно сделать.

Да, но для этого нужно иметь качественно размеченные 10+ часов (а чтобы хорошо работало - сильно больше). Классическую архитектуру можно адаптировать под клиента имея только тексты. Но скорее всего архитектуры подобные Wav2Vec2.0 скоро окончательно победят гибриды.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
amvera.ru
Дата регистрации
Численность
11–30 человек
Местоположение
Россия
Представитель
Кирилл Косолапов