ElKornacio Feb 26 at 20:48

Вышел ElevenLabs Scribe: распознавание речи лучше Whisper v3 и Gemini 2.0

2 min

5.4K

Machine learning * Artificial IntelligenceVoice user interfaces *

Comments 10

un1t Feb 26 at 21:07

Самое главное не написали - цена.

aborouhin Feb 26 at 21:25

Не очень корректно сравнивать платный API с бесплатной локальной моделью.

P.S. Кстати, а кто что использует для диктовки в Windows через Whisper? Интересует не управление системой, а именно набор текста в любом приложении по хоткею или иным удобным способом (без переключения в отдельную программу). По функционалу мне идеально зашёл SpeechPulse, но глючен до невозможности :(

pk2002pc Feb 28 at 12:06

В Windows 11 есть встроенный инструмент, вызывается по Win+H (работает на русском)

aborouhin Feb 28 at 20:40

Качество распознавания кардинально хуже, чем даёт Whisper. Я разные технологии распознавания речи периодически пробовал (начиная с Dragon Dictation под Win95 почти 30 лет назад) - и до появления Whisper всё это не оправдывало себя, т.к. править надиктованное приходилось дольше, чем изначально набить на клавиатуре.

Только сейчас нейросети стали давать отличный результат. Не только Whisper - скажем, сберовский SaluteSpeech гораздо лучше Whisper на записях плохого качества. Но Whisper работает локально (на RTX3060 c 6 Гб VRAM полная модель large v3 летает), что для такого сценария использования важно.

bambampogubam Feb 26 at 22:57

Сколько ещё появится таких оборзевателей с глубокой аналитикой?

Вопрос риторический, конечно же.

REPISOT Feb 27 at 02:21

ElevenLabs

Это отсылка на видео с лифтом?

rPman Feb 27 at 02:50

как интересно, изначально в статье было написано про автономность, мой комментарий был удален и статья поправлена... это правильно, но как мой коммент удалили и главное зачем?

Ingref Feb 27 at 08:19

Ваш комментарий мирно покоится в соседней новости - https://habr.com/ru/companies/bothub/news/886176/#comment_27975764

Там автор имел в виду, что до этого модель использовалась только для их собственных диалоговых агентов, а теперь её можно использовать и без них.

rPman Feb 27 at 08:24

уже сообразил, но странно то что та новость у меня вылезла в подписках, потому то я и удивился что моего комментария там нет

Abbavar Feb 28 at 05:12

Так это другая новость, комментарий на месте