Как стать автором
Обновить

ТОП-5 нейросетей для транскрибации аудио в текст (часть 1)

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров2.8K
Всего голосов 17: ↑15 и ↓2+14
Комментарии11

Комментарии 11

Для теста нейросети я буду использовать платформу BotHub

В тегах статьи не хватает слова «Самореклама».

Заметьте: в этих статьях мы рассматриваем пять разных моделей/онлайн-сервисов, один экземпляр из которых — AssemblyAI, запущенный через BotHub)

5р за пару строчек Ж)

Дело в том, что стоимость округляется до минуты вверх. На скриншотах рядом видно, что более крупные фрагменты текста по такой же стоимости (потому что длительность отрывков тоже менее 1 минуты).

Сравните пожалуйста с tl;dv - у них бесплатная транскрипция онлайн звонков без лимитов. По качеству понимания слов чуть хуже Гугла (которого у вас нет) зато знаки препинания расставляет качественно. И более менее адекватно распознает иностранные слова в русской речи.

Вот чего никогда не понимал - так это существования всяких подкастов. Может слушать (если чем-то занят) и удобно, только вот если надо осуществить по этому поиск - всё тут же становится очень плохо. Чую, возможность поиска (а-ля Гугл) по этому всему появится ещё не скоро (и всякие юридические проблемы всплывут заодно). В общем: спасибо за информацию, ждём продолжения и результатов 👍

В Microsoft 365 Copilot есть бесплатная диктовка и платное транскрибирование записей. Мне захотелось бесплатно и я через костыли скормил аудиофайл в Диктовку :)

Нужно рассматривать self hosted решения. Всё эти облака не надёжны, не годятся.

А с Whisper пробовали сравнивать? Хотя чую под капотом у всех этих сервисов именно он. Я буквально месяц назад на старенькой gtx1060 перевел в текст 40 видео лекций, что бы подготовиться к экзамену. Качество получилось отменным: оформил как субтитры и смотрел в параллель с видео. Понятно, что лектор один, с хорошим произношением - не надо разбивать на "кто говорит" и компенсировать дефекты речи. Но и whisper стоит ровным счётом почти ничего. Я даже запускал его под android в termux - да долго, но работает же.

Pro версия же платная. А только в ней есть более менее вменяемые модели, но и в них качество не идеальное.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий