Комментарии 4
В Bark еще можно генерировать/клонировать голоса. Очень легко сделать голос по своему вкусу вместо стандартного встроенного.
Плюс, существует фреймворк Bark Infinity с автоматической нарезкой длинного текста и другими плюшками.
Мне не хватало только возможности стримить аудио с низкой задержкой (барк хоть и работает быстрее, чем в реальном времени, но приходится ждать пока будет готов кусок в 11-13 секунд). Поэтому переключился на Coqui TTSv2, там стриминг из коробки работает.
+1
Спасибо!
Может есть ещё рекомендации по клонированию голоса + переводу на другой язык? Очень интересно подобное решение (видел платные сервисы только, хотя глубокий ресерч ещё не производил).
+1
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
YouTube Shorts из терминала. Как автоматизировать создание видео с помощью FFMPEG и Bash. Часть 2