Комментарии 3
Если проблему решить не удается, остается самый трудоемкий вариант — набирать субтитры на слух.
Ещё Whisper.cpp выручить может. Как раз им снимаем текст с записей конференции сейчас, результат довольно неплохой. Хотя доводка напильником таки требуется.
+2
набирать субтитры на слух
А работает ли способ, когда какой-то человек с хорошо поставленной дикцией и привыкший к тому, как его комп понимает, повторяет все что слышит в программу распознавания?
+2
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Сложности подготовки текста из видео