Обновить
47
0
tkf@tkf

Пользователь

Отправить сообщение
угу умеет habrahabr.ru/blogs/linux/60977/#comment_1671419
Сейчас сделал замеры, для кусков речи длинной в секунду и в 5 секунд, перед началом синтеза он думает приблизительно 1,5 секунды.
Даже не знаю как бы это замерить, если есть предложения как правильно это измерить то могу провести тесты.
Для виндошного голоса не знаю, под рукой нет винды :)
а для festival'а делаем вот так.
cat book.txt | text2wave -o file.wav -eval '(voice_msu_ru_nsh_clunits)'
получившийся wav файл сжимаем lame'ом.
lame file.wav file.mp3
А с полученной mp3 шкой можно делать что угодно.
Угу, задержка у него что то уж очень значительная, не сказать чтобы у меня уж шибко мощная система, но на мой взгляд он столько думает сколько он думать не должен.
это билд с того же сайта откуда я брал голос. Версия вроде та же :(
Запишем подкаст из общения TTS'ок ^_^
Дамс, качество у вашего синтезатора получше, но ничего и наш дорастет.
Выложил примеры синтеза речи. Пока выложил на народ, если кто может предложить другое место, то воспользуюсь с удовольствием
Ну что же, попробовал espeak. Качество просто ужас. Далекий до идеала Festival заметно лучше espeak'a.
Так как тема самому интересно, то надо будет попробовать. Хотя я слышал что качество распознование оставляет желать много лучшего.
Ну SAPI и голосовой движок под вайном это имхо извращение, как говорит всегда мой знакомый «Если ты юзаешь софт под вайном, а зачем тебе собственно прослойка в виде linux'a»
^_^ к тому же интеграции с программами которые поддерживают festival не будет.
Странно, я не ждал в комментариях ответ на главный вопрос жизни, вселенной и всего такого. Я и так знаю что 42.
Просто во время своих экспериментов я потратил достаточно времени на гугления, и поэтому решил поделиться своими изысканиями.
Голосовой движок под Microsoft'ский SAPI. В этом комменте выкладывали пример habrahabr.ru/blogs/powershell/60965/#comment_1666861
сейчас проверим. Просто у espeak в поддерживаемых языках (http://espeak.sourceforge.net/languages.html) для русского написано So far it's just an initial attempt with basic pronunciation rules.
Но надо попробовать. Как попробую отпишусь.
Качество речи чем то сильно напоминает Мерлина майкрософтсовского, то есть не блещет.
Ну я прочитал про виндовый аналог, и мне стало интересно а как с этим сейчас под линем. ^_^
Дамс, качество речи festival отдыхает, даже обидно как то :(
Юзаю тоже похожую схему, но использоваться это будет не как CMS ^_^
Ну захотелось мне адресную книгу…
блин ну зачем они поменяли местами Fn и Ctrl. Такой бы девайс хороший получился.
а можно где то пример увидеть чтобы посмотреть что может быть не так?
ммм а welinux как? он конечно немного специфичен, но что то много соцсетей стало

Информация

В рейтинге
Не участвует
Откуда
Россия
Дата рождения
Зарегистрирован
Активность