Comments 4
Не понял зачем всё это если гпт не смог ничего сделать с распознанным текстом. Ни пересказа ни поиска ничего? Почему бы тогда не распознавать текст после выбора случайной записи.
У виспера кроме вставки мусора из субтитров есть еще одна проблема, она вылезает на записях большого размера, когда там несколько минут речи. Он принимает за оговорки целые предложения и абзацы и вырезает их полностью. Непонятно как с этим безобразием бороться, приходится использовать другие движки оставив висперу только короткие записи.
Поиск как раз есть и это главное! Плюс к этому, в текстовом виде работать с заметками гораздо проще и быстрее чем с аудио.
Про длинные записи с wisper, любопытно, возможно у меня не было таких длинных. А какие движки вы используете?
google gemini умеет распознавать голос, бесплатный ключ дает 1500 запросов в сутки
Еще есть такой сервис - https://www.assemblyai.com/ там новым юзерам дают ключ на 100 часов, и для регистрации нужна только почта. Он вообще шикарный.
30k аудиозаписей: наводим порядок