Комментарии 11
5р за пару строчек Ж)

Сравните пожалуйста с tl;dv - у них бесплатная транскрипция онлайн звонков без лимитов. По качеству понимания слов чуть хуже Гугла (которого у вас нет) зато знаки препинания расставляет качественно. И более менее адекватно распознает иностранные слова в русской речи.
Вот чего никогда не понимал - так это существования всяких подкастов. Может слушать (если чем-то занят) и удобно, только вот если надо осуществить по этому поиск - всё тут же становится очень плохо. Чую, возможность поиска (а-ля Гугл) по этому всему появится ещё не скоро (и всякие юридические проблемы всплывут заодно). В общем: спасибо за информацию, ждём продолжения и результатов 👍
В Microsoft 365 Copilot есть бесплатная диктовка и платное транскрибирование записей. Мне захотелось бесплатно и я через костыли скормил аудиофайл в Диктовку :)
Нужно рассматривать self hosted решения. Всё эти облака не надёжны, не годятся.
А с Whisper пробовали сравнивать? Хотя чую под капотом у всех этих сервисов именно он. Я буквально месяц назад на старенькой gtx1060 перевел в текст 40 видео лекций, что бы подготовиться к экзамену. Качество получилось отменным: оформил как субтитры и смотрел в параллель с видео. Понятно, что лектор один, с хорошим произношением - не надо разбивать на "кто говорит" и компенсировать дефекты речи. Но и whisper стоит ровным счётом почти ничего. Я даже запускал его под android в termux - да долго, но работает же.
Pro версия же платная. А только в ней есть более менее вменяемые модели, но и в них качество не идеальное.
https://github.com/ggml-org/whisper.cpp/blob/master/models/README.md брал large-v3-turbo, качество отличное. Не очень понял про pro версию. Я что-то упускаю?
ТОП-5 нейросетей для транскрибации аудио в текст (часть 1)