Comments 58
UFO just landed and posted this here
Как всегда имеем дело с хитрой системой костылей и подпорок. Linux…
Спасибо за заметку, будем пробовать.
Спасибо за заметку, будем пробовать.
еще на 8.10 (или раньше) я как-то обнаружил команду:
'espeak'
она мне читала текстовый файл с нашими стихами и мы с подругой ухахатывались!!!
русский тоже присутствовал.
смотрите 'man espeak'…
'espeak'
она мне читала текстовый файл с нашими стихами и мы с подругой ухахатывались!!!
русский тоже присутствовал.
смотрите 'man espeak'…
сейчас проверим. Просто у espeak в поддерживаемых языках (http://espeak.sourceforge.net/languages.html) для русского написано So far it's just an initial attempt with basic pronunciation rules.
Но надо попробовать. Как попробую отпишусь.
Но надо попробовать. Как попробую отпишусь.
у меня при попытке
espeak -f game.log
espeak: wave_pulse.cpp:707: size_t wave_write(void*, char*, size_t): Assertion `stream' failed.
Aborted
espeak -f game.log
espeak: wave_pulse.cpp:707: size_t wave_write(void*, char*, size_t): Assertion `stream' failed.
Aborted
Ну что же, попробовал espeak. Качество просто ужас. Далекий до идеала Festival заметно лучше espeak'a.
Вообщем www.acapela.tv/ хорошая тема
Теперь будет с кем поговорить, холодными сибирскими ночами xD А как качество речи? не режет слух?
ну вот опять.
зачем пост сразу после виндового аналога.
эх, сейчас посыпятся холивары.
зачем пост сразу после виндового аналога.
эх, сейчас посыпятся холивары.
Ну я прочитал про виндовый аналог, и мне стало интересно а как с этим сейчас под линем. ^_^
Мне кажется, что подобные посты с не до конца полученным результатом стимулируют вытягивание знаний из ленивых, но знающих эту тему профи. Самим писать статью лень («Ну это же очевидно!») а вот в комментах кто-нибудь да и напишет что-то в стиле «Вы не правы, под линуксом легко и непринужденно текст читает прога %appName%! Почитайте вот этот мануал». Не оставаться же равнодушным, когда в соседнем посте под виндой все гладко и красиво.
Странно, я не ждал в комментариях ответ на главный вопрос жизни, вселенной и всего такого. Я и так знаю что 42.
Просто во время своих экспериментов я потратил достаточно времени на гугления, и поэтому решил поделиться своими изысканиями.
Просто во время своих экспериментов я потратил достаточно времени на гугления, и поэтому решил поделиться своими изысканиями.
простите не в тему (возможно офтопик),
то статью я написать не могу:
1. я был на работе и занят (когда комментировал)
2. у меня карма минусовая (могу только комментировать)
то статью я написать не могу:
1. я был на работе и занят (когда комментировал)
2. у меня карма минусовая (могу только комментировать)
Этот пакет можно не ставить ручками, а подключить вот этот ppa.
Автор, напиши лучше про распознование речи, к примеру Sphinx
Мне так и не удалось его настроить
Мне так и не удалось его настроить
«качество синтеза далеко до голоса Алены»
А с чего это линуксоид мечтает о голосе Алены? Только Ричард и Линус!
А с чего это линуксоид мечтает о голосе Алены? Только Ричард и Линус!
А кто такая Алена?
Роскошная женщина с сексуальным голосом.
Голосовой движок под Microsoft'ский SAPI. В этом комменте выкладывали пример habrahabr.ru/blogs/powershell/60965/#comment_1666861
Можно поставить под вайн SAPI и Голосовой движок, а потом использовать govorilka cp. К сожалению на данный момент лучшие русскоязычные движки под винду. Медвед чтоли бы денег подкинул на развитие отечественных голосовых технологий под линукс. Это же важно на самом деле.
Выложил примеры синтеза речи. Пока выложил на народ, если кто может предложить другое место, то воспользуюсь с удовольствием
Ох, Алёнушка… *мечтательно вздыхает*
UFO just landed and posted this here
forum.sources.ru/index.php?showtopic=204030&view=showall
вот тут предлагают голос чуть по лучше, судя по образцу синтеза. сам не ставил.
вот тут предлагают голос чуть по лучше, судя по образцу синтеза. сам не ставил.
UFO just landed and posted this here
Позволю себе дать ссылку archlinux.org.ru/arch_forum/viewtopic.php?f=8&t=1509&p=13915#p13915 Все достаточно грамотно расписано.
Даёшь хабраинтервью (подкаст) с диктором — прототипом Алёны!
напишите как сделать из воспроизведения текста mp3 файл, а потом разбить на файлы по 4-5м
тогда можно будет создавать аудио книги самостоятельно :)
уверен это будет интересно
тогда можно будет создавать аудио книги самостоятельно :)
уверен это будет интересно
Для виндошного голоса не знаю, под рукой нет винды :)
а для festival'а делаем вот так.
cat book.txt | text2wave -o file.wav -eval '(voice_msu_ru_nsh_clunits)'
получившийся wav файл сжимаем lame'ом.
lame file.wav file.mp3
А с полученной mp3 шкой можно делать что угодно.
а для festival'а делаем вот так.
cat book.txt | text2wave -o file.wav -eval '(voice_msu_ru_nsh_clunits)'
получившийся wav файл сжимаем lame'ом.
lame file.wav file.mp3
А с полученной mp3 шкой можно делать что угодно.
Спасибо!
win тут и не причём :)
осталось найти простой способ сделать split для mp3 :)
win тут и не причём :)
осталось найти простой способ сделать split для mp3 :)
не уверен поможет ли вам, но посмотреть в эту сторону mp3splt.sourceforge.net/mp3splt_page/home.php, сам не пользовался поэтому ничего сказать не могу.
к плюсам Фестиваля стоит упомянуть поддержку в VoIP станции Asterisk:
www.voip-info.org/wiki/view/Asterisk+festival+installation
это может серёзно разнообразить телефонийный экспириенс.
другое дело, что задержка на синтез может оказаться неприемлемой в интерактивном режиме.
www.voip-info.org/wiki/view/Asterisk+festival+installation
это может серёзно разнообразить телефонийный экспириенс.
другое дело, что задержка на синтез может оказаться неприемлемой в интерактивном режиме.
Угу, задержка у него что то уж очень значительная, не сказать чтобы у меня уж шибко мощная система, но на мой взгляд он столько думает сколько он думать не должен.
а есть конкретные замеры затрат времени на синтез?
Даже не знаю как бы это замерить, если есть предложения как правильно это измерить то могу провести тесты.
думаю, хорошим оценочным параметром может служить отношение времени синтеза к времени звучания.
на достаточно длинных фразах, по идее, оно должно стремиться к какому-то фиксированному значению.
оно же умеет генерить звук в файл?
на достаточно длинных фразах, по идее, оно должно стремиться к какому-то фиксированному значению.
оно же умеет генерить звук в файл?
угу умеет habrahabr.ru/blogs/linux/60977/#comment_1671419
Сейчас сделал замеры, для кусков речи длинной в секунду и в 5 секунд, перед началом синтеза он думает приблизительно 1,5 секунды.
Сейчас сделал замеры, для кусков речи длинной в секунду и в 5 секунд, перед началом синтеза он думает приблизительно 1,5 секунды.
Русский голос довольно объемный, можно исключить время загрузки используя сервер. Подключил так MCabber и IRSSI
$ festival --server
$ cat speaker.py
…
CMD_MSG_SAY = 'echo "%s" | festival_client --async --ttw --aucommand \'aplay $FILE\''
$ festival --server
$ cat speaker.py
…
CMD_MSG_SAY = 'echo "%s" | festival_client --async --ttw --aucommand \'aplay $FILE\''
что-то не понял, как это поможет сократить время загрузки?
особенно в контексте использования изнутри астериска…
особенно в контексте использования изнутри астериска…
При запуске festival'a происходит чтение всех необходимых правил для русского языка, и для самого festival'a. Если же исключить загрузку, то есть запустить festival как сервер, то все правила уже будут загруженны, и по идее должно быстрее работать
Перепостила Вашу статью в community.livejournal.com/ru_wearable/55002.html (со ссылками и указанием авторства), если Вы против — скажите, уберу пост.
Хороший материал, есть только момент — да, это работает после плясок из консоли. Но увы, не работает в KDE 3.5
Sign up to leave a comment.
Синтез русской речи в Linux