Вышел открытый проект Voicebox — локальная нейросеть‑клонер, по сути бесплатная альтернатива ElevenLabs. Это буквально «голосовой фотошоп» без ограничений и подписок. Работает просто: загрузили короткий кусок аудио — получили голос.
Клонирует голос по короткому аудио.
Генерирует речь из текста любым клоном.
Собирает разговоры/подкасты из нескольких голосов.
Записывает и расшифровывает аудио.
Все работает локально. Все проекты и озвучки хранятся на ПК. Дальше можно озвучивать тексты, видео, презентации, мемы или делать диалоги из нескольких голосов.

