
Комментарии 9
А на ПК с линуксом на https://notebooklm.google.com/ никак не выйдет зайти?
А зачем нужен " yt‑dlp.exe"?
Можно просто написать:
yt-dlp -x --embed-thumbnail -f "bestaudio[ext=m4a]/bestaudio[ext=webm]/bestaudio" https://www.youtube.com/watch?v=xxxxxxxxxx -P "C:\Audio\"
…и получить готовый аудиофайл. Ещё и с картинкой, чтобы не запутаться, от какого он видоса.
Мне тут подсказали, что нехрен греть воздух, перекодируя в .mp3, лучше просто извлечь аудиопоток. Так оно и оказалось. Размер аудио одинаковый, а команда выше выполняется со скоростью скачивания (перекодирование заняло бы ещё примерно столько же времени).
Эээ. Я бы мог себе представить статью, которая покрывает компилляциию crispasr с учётом ffmpeg\openblas для запуска parakett, причем разрешается на вход подавать vorbis ogg. Вот это я понимаю решение вопроса бесплатной транскибации НА Компьютере с Windows, как обещал заголовок.
А в статье оказалось описание облачного решения. Печалька...
в ffmpeg 8.0+ есть whisper от openai для транскрибирования аудио
Виспер, к сожалению, проигрывает по скорости parakeet примерно в 60 раз на моей машине без GPU.
Почему к сожалению? Потому, что он видит иноязычные слова и транскрибирует их, чаще всего, правильно. Попугай же, работает мгновенно, но выдает, например, "часть джипити" - это "Chat GPT" у whisper.
Вместо
[имя пользователя]нужно написать того пользователя, под которым вы входите в Windows.
В такой статье можно хотя бы вспомнить про %USERPROFILE%\Downloads и не заниматься фигней с именем пользователя.
На винде: Я это делаю xmedia-recode. Это и MKVToolNix у меня для всего.
Половина перечисленных операций (установка yt-dlp и FFmpeg) решается установкой Chocolatey и последующей установкой любого софта через него.
Если есть немного денег, то любая настройка — это вообще просьба в Codex. У меня сейчас на рабочем столе лежит ярлык, при перетаскивании в который файла или ссылки (или этот скрипт попросит УРЛ на видеохостинг) он автоматически скачает видеоролик, транскрибирует его в полноценные субтитры через Whisper на видеокарте и раздербанит на интересные кадры, готовые к публикации на Хабре и уже отсортированные базовыми алгоритмами машинного зрения.
Бесплатная транскрибация любого видео и аудио на ПК с Windows