Обновить

Комментарии 9

А зачем нужен " yt‑dlp.exe"?

Можно просто написать:

yt-dlp -x --embed-thumbnail -f "bestaudio[ext=m4a]/bestaudio[ext=webm]/bestaudio" https://www.youtube.com/watch?v=xxxxxxxxxx -P "C:\Audio\"

…и получить готовый аудиофайл. Ещё и с картинкой, чтобы не запутаться, от какого он видоса.

Мне тут подсказали, что нехрен греть воздух, перекодируя в .mp3, лучше просто извлечь аудиопоток. Так оно и оказалось. Размер аудио одинаковый, а команда выше выполняется со скоростью скачивания (перекодирование заняло бы ещё примерно столько же времени).

Эээ. Я бы мог себе представить статью, которая покрывает компилляциию crispasr с учётом ffmpeg\openblas для запуска parakett, причем разрешается на вход подавать vorbis ogg. Вот это я понимаю решение вопроса бесплатной транскибации НА Компьютере с Windows, как обещал заголовок.

А в статье оказалось описание облачного решения. Печалька...

в ffmpeg 8.0+ есть whisper от openai для транскрибирования аудио

Виспер, к сожалению, проигрывает по скорости parakeet примерно в 60 раз на моей машине без GPU.
Почему к сожалению? Потому, что он видит иноязычные слова и транскрибирует их, чаще всего, правильно. Попугай же, работает мгновенно, но выдает, например, "часть джипити" - это "Chat GPT" у whisper.

Вместо [имя пользователя] нужно написать того пользователя, под которым вы входите в Windows.

В такой статье можно хотя бы вспомнить про %USERPROFILE%\Downloads и не заниматься фигней с именем пользователя.

На винде: Я это делаю xmedia-recode. Это и MKVToolNix у меня для всего.

Половина перечисленных операций (установка yt-dlp и FFmpeg) решается установкой Chocolatey и последующей установкой любого софта через него.

Если есть немного денег, то любая настройка — это вообще просьба в Codex. У меня сейчас на рабочем столе лежит ярлык, при перетаскивании в который файла или ссылки (или этот скрипт попросит УРЛ на видеохостинг) он автоматически скачает видеоролик, транскрибирует его в полноценные субтитры через Whisper на видеокарте и раздербанит на интересные кадры, готовые к публикации на Хабре и уже отсортированные базовыми алгоритмами машинного зрения.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации