Amvera_Speech 6 окт 2022 в 06:58

Чем гибридные системы распознавания речи лучше End-to-End решений

4 мин

3.2K

Блог компании AmveraМашинное обучение*Читальный залОблачные сервисы*Искусственный интеллект

Комментарии 3

volchenkodmitriy 6 окт 2022 в 09:30

Я помню готовился к сдаче экзамена по Английскому еще давно в начале 2000х, используя механизм обучения программы распознавания речи: читал в микрофон предложения с экрана на английском и программа указывала что распознала, а что нет. В результате я научился говорить правильно и сдал экзамен хорошо, а научилась ли чему-то программа до сих пор не знаю)

AigizK 6 окт 2022 в 10:51

Тот же Wav2Vec2.0 обученный на англ, можно дообучить на других языках. При этом достаточно 10+ часов. И времени не много требует, на том же Colabe можно сделать.

kirillkosolapov 6 окт 2022 в 11:01

Да, но для этого нужно иметь качественно размеченные 10+ часов (а чтобы хорошо работало - сильно больше). Классическую архитектуру можно адаптировать под клиента имея только тексты. Но скорее всего архитектуры подобные Wav2Vec2.0 скоро окончательно победят гибриды.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий