
Стартап Resemble AI выпустил Chatterbox Turbo - открытую модель для превращения текста в речь, которая умеет клонировать голос всего по пятисекундной записи. Компания утверждает, что ее решение обходит Elevenlabs и Cartesia по качеству голоса и выдает первый результат менее чем за 150 миллисекунд.
Такая скорость может заинтересовать разработчиков онлайн-агентов, систем поддержки, игр, аватаров и социальных платформ. Для компаний из регулируемых сфер в модели встроен водяной знак PerTh, позволяющий подтвердить, что речь создал ИИ.
Chatterbox Turbo распространяется по лицензии MIT - использовать, изменять и распространять ее можно бесплатно, включая для бизнеса. Модель доступна для тестирования на Hugging Face, RunPod, Modal, Replicate и Fal, а полный код - на GitHub. Кроме того, Resemble AI предлагает собственный хостинг и готовит версию с минимальной задержкой.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
