Комментарии 4
ох, времена дикого запада, когда все корпы свои сетки так нехило нахваливают, потому что доступ по приглашениям, конкурировать открытостью еще не надо
что из этого всего по результату тихонечько, без понтов, анонсов, научных публикаций, не может elevenlabs?
https://github.com/ex3ndr/supervoice-vall-e-2 полная репродукция за парой фиксов
Спасибо за ваш комментарий!
Вы правы, есть открытые проекты, такие как supervoice-vall-e-2, которые достигают впечатляющих результатов без лишнего шума. И ElevenLabs также предлагает качественные решения в области синтеза речи. Круто, что у нас есть выбор между открытыми и коммерческими инструментами, поэтому каждый может найти то, что ему подходит.
Спасибо за полезную статью!
", достигнув человеческого уровня впервые. " Это только мне режет глаз или уже норма?
VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot