Комментарии 3
А русскоязычный синтез уже пробовали, какой результат?
Пробовали, но не в комбинации Feature Prediction Net + Wavenet (что дает высококачественную речь), а в комбинации Feature Prediction Net + Griffin-Lim алгоритм. Задачи русскоязычного синтеза у нас не было, просто было интересно. И в сгенерированной речи встречались некоторые артефакты неверного произношения. Причиной могут быть специфика данных или фонетические особенности — и тут может понадобится некоторая кастомизация энкодера. Но точно сказать не беремся, так как детально вопрос синтеза русской речи не исследовали.
А есть какие то открытые фреймворки для конкатенативного синтеза речи?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Нейросетевой синтез речи с помощью архитектуры Tacotron 2, или «Get alignment or die tryin'»