В силу служебной необходимости разбирался с рынком промышленных движков по преобразованию текста в речь.
Рынок не сказать, что бы огромен, но достаточно стар.
В России собственные разработки представлены в Центре Речевых Технологий (они же ЦРТ).
Среди популярных Nuance (TTS Milena). Бюджетный проект 09 (комерческий проект 099) реализован на базе Nuance. Интегратором выступила компания Logictel , которая на самом деле это Сател.
В России данный продукт представляют Open Communication, Voxcom и многие другие.
Ещё один менее качественный продукт от компании ScanSoft (TTS Katerina), признаться так себе.
Другой продукт представлен компанией Loquendo (TTS Olga). В России на данный момент по моим сведения пока никто не представляет. Если ошибаюсь, буду приятно удивлён.
С наладкой TTS всё относительно просто. Разработчик должен оперировать с фонемами конкретного языка. А уже потом происходит нормализация, когда произнесение отдельных слов докручивают до идеала. Для это существуют Speech API, VoiceXML, SML и т.п.
Рынок не сказать, что бы огромен, но достаточно стар.
В России собственные разработки представлены в Центре Речевых Технологий (они же ЦРТ).
Среди популярных Nuance (TTS Milena). Бюджетный проект 09 (комерческий проект 099) реализован на базе Nuance. Интегратором выступила компания Logictel , которая на самом деле это Сател.
В России данный продукт представляют Open Communication, Voxcom и многие другие.
Ещё один менее качественный продукт от компании ScanSoft (TTS Katerina), признаться так себе.
Другой продукт представлен компанией Loquendo (TTS Olga). В России на данный момент по моим сведения пока никто не представляет. Если ошибаюсь, буду приятно удивлён.
С наладкой TTS всё относительно просто. Разработчик должен оперировать с фонемами конкретного языка. А уже потом происходит нормализация, когда произнесение отдельных слов докручивают до идеала. Для это существуют Speech API, VoiceXML, SML и т.п.