Pull to refresh
1
0
Send message

Будут ли модели с количеством параметров поменьше? Интересует дообучение на примерах диалогов из игр для получения "говорилки в стиле персонажа А". На английском для этого есть dialoGPT, на русском до сих пор ничего внятного.

Потрясающий проект! Один из немногих доступных именно с русскоязычными моделями (даже мультиязычными и с хорошим качеством!!). Русский в вашей модели даже звучит лучше и приятнее чем LJSpeech в других английских такатронах2 (или он просто приелся, у них ведь стандарт - использовать LJ для демонстрации всего и вся).
Сборка с запуском буквальном с пары строчек и от одного pytorch - волшебно, после запусков flowtron от nvidia :D (где ещё нужно подобрать версиии всех модулей, чтобы они друг с другом не конфликтовали).

Прочитал обе ваших статьи. Совершенно справедливые замечания про черри-пики всех артефактов/косяков от исходника. Заметил, что Вы постоянно ставите целью "ускорить работу в 5-10 раз", что (невероятно), но удаётся!
Однако когда ради этого приходится жертвовать качеством голоса, теряется изначальная цель всех долгих обучений и обработок датасета.. Поэтому если есть возможность выложить не самые производительные, но более качественные модели, это было бы замечательно!
А насчёт мошенников.. Они всё равно найдут способ, до чтения этой статьи я как-то даже и не думал, что могут использовать в таком ключе синтез речи. Им ведь логичнее было бы предзаписать фразы живым голосом? Хотя я конечно не знаю, как они там работают :)

Information

Rating
Does not participate
Registered
Activity