Для виндошного голоса не знаю, под рукой нет винды :)
а для festival'а делаем вот так.
cat book.txt | text2wave -o file.wav -eval '(voice_msu_ru_nsh_clunits)'
получившийся wav файл сжимаем lame'ом.
lame file.wav file.mp3
А с полученной mp3 шкой можно делать что угодно.
Угу, задержка у него что то уж очень значительная, не сказать чтобы у меня уж шибко мощная система, но на мой взгляд он столько думает сколько он думать не должен.
Ну SAPI и голосовой движок под вайном это имхо извращение, как говорит всегда мой знакомый «Если ты юзаешь софт под вайном, а зачем тебе собственно прослойка в виде linux'a»
^_^ к тому же интеграции с программами которые поддерживают festival не будет.
Странно, я не ждал в комментариях ответ на главный вопрос жизни, вселенной и всего такого. Я и так знаю что 42.
Просто во время своих экспериментов я потратил достаточно времени на гугления, и поэтому решил поделиться своими изысканиями.
сейчас проверим. Просто у espeak в поддерживаемых языках (http://espeak.sourceforge.net/languages.html) для русского написано So far it's just an initial attempt with basic pronunciation rules.
Но надо попробовать. Как попробую отпишусь.
Сейчас сделал замеры, для кусков речи длинной в секунду и в 5 секунд, перед началом синтеза он думает приблизительно 1,5 секунды.
а для festival'а делаем вот так.
cat book.txt | text2wave -o file.wav -eval '(voice_msu_ru_nsh_clunits)'
получившийся wav файл сжимаем lame'ом.
lame file.wav file.mp3
А с полученной mp3 шкой можно делать что угодно.
Дамс, качество у вашего синтезатора получше, но ничего и наш дорастет.
^_^ к тому же интеграции с программами которые поддерживают festival не будет.
Просто во время своих экспериментов я потратил достаточно времени на гугления, и поэтому решил поделиться своими изысканиями.
Но надо попробовать. Как попробую отпишусь.
Ну захотелось мне адресную книгу…