Обновить

Комментарии 3

Сударь. Вам еще в чатике распознавания речи написали, что реппозиторий https://github.com/borisovai/voice‑input отдает 404, оценить код никто не сможет...

Также есть отдельные настройки по шумодаву и в некоторых ситуациях, может вести себя не так как ожидается - например если говорить очень громко, может заигнорить и пропустить.

На каких данных сверяли wer?

Статью нагаллюцинировал ИИ, ссылка выдумана. :-D

а  parakeet-tdt-0.6b-v3 смотрели? он вроде лучше виспера, и есть разные форматы. 

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации