Как стать автором
Обновить

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.8K
Всего голосов 2: ↑2 и ↓0+4
Комментарии4

Комментарии 4

ох, времена дикого запада, когда все корпы свои сетки так нехило нахваливают, потому что доступ по приглашениям, конкурировать открытостью еще не надо

что из этого всего по результату тихонечько, без понтов, анонсов, научных публикаций, не может elevenlabs?

https://github.com/ex3ndr/supervoice-vall-e-2 полная репродукция за парой фиксов

Спасибо за ваш комментарий!

Вы правы, есть открытые проекты, такие как supervoice-vall-e-2, которые достигают впечатляющих результатов без лишнего шума. И ElevenLabs также предлагает качественные решения в области синтеза речи. Круто, что у нас есть выбор между открытыми и коммерческими инструментами, поэтому каждый может найти то, что ему подходит.

", достигнув человеческого уровня впервые. " Это только мне режет глаз или уже норма?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации