Центр речевых технологий (ЦРТ), Санкт-Петербург / Статьи / Хабр

Компания Центр речевых технологий (ЦРТ) временно не ведёт блог на Хабре

Статьи 34Посты

olezhkapetrov 17 мая 2018 в 18:57

Нейросетевой синтез речи своими руками

12 мин

92K

Блог компании Центр речевых технологий (ЦРТ)Машинное обучение*

Из песочницы

Синтез речи на сегодняшний день применяется в самых разных областях. Это и голосовые ассистенты, и IVR-системы, и умные дома, и еще много чего. Сама по себе задача, на мой вкус, очень наглядная и понятная: написанный текст должен произноситься так, как это бы сделал человек.

Некоторое время назад в область синтеза речи, как и во многие другие области, пришло машинное обучение. Выяснилось, что целый ряд компонентов всей системы можно заменить на нейронные сети, что позволит не просто приблизиться по качеству к существующим алгоритмам, а даже значительно их превзойти.

Я решил попробовать сделать полностью нейросетевой синтез своими руками, а заодно и поделиться с сообществом своим опытом. Что из этого получилось, можно узнать, заглянув под кат.

+60

mulai 26 июл 2011 в 13:50

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 1

9 мин

30K

Блог компании Центр речевых технологий (ЦРТ)Asterisk*Разработка систем связи*

Часть 2
Часть 3
Часть 4

Учитывая, возросший интерес сообщества к Asterisk решил внести и свою лепту и рассказать о построении голосовых меню с использованием синтеза и распознавания речи.

Статья рассчитана на специалистов, имеющих опыт работы с построением IVR в Asterisk и имеющих представление о системах голосового самообслуживания.

СГС (системы голосового самообслуживания) значительно расширяют возможности по созданию голосовых приложений и позволяют пользователю получать информацию и заказывать услуги самостоятельно, без участия оператора. Это может быть маршрутизация вызовов, запрос и выдача информации по расписанию авиарейсов, состояние банковского счета, заказ такси, запись на прием к врачу и пр.
Распознавание позволяет отказаться от линейных меню, создаваемых с помощью DTMF, разговаривать с системой человеческим языком и легко создавать меню с множественным выбором.
Синтез значительно упрощает работу с динамически меняющейся информацией и большими объемами текстовых данных.

Использование языка разметки SSML

Введение

От чего защищаем?

Всем привет!

Зачем банку биометрия

Зачем в КЦ нужна речевая аналитика?

Победители получат ценные призы и работу мечты!

График проведения конкурса: