Спасибо что написали эту статью а то я так и не собрался :D. От себя хочу добавить: этим летом в рамках GSoC я добавил поддержку использования Sphinx, как бэкенда для Simon (раньше он поддерживал толькко упомянутый вами Julius), который позволяет реализовать голосовое управление на довольно сложном уровне. Поддержка sphinx присутствует начиная с версии 0.4.
Думаю будет полезно упомянуть Simon в статье:). Также если у кого либо есть вопросы относительно него — могу постараться ответить:)
Да, но, как уже писалось, GG, скорее всего, будут привязываться к голосу владельца (возможно, функция отключаемая) и, вероятно, микрофон для команд будет направленный, а для записи будет использоваться другой, да и кодовое слово никто не отменял.
Ну а с офисом конкурентов — либо заметно позже 2015, либо, опять же, привязка к голосу, тогда вообще никогда)
>В 1997-ом году Лукьяненко пророчил для десктопа сочетание CLI и голосового управления
пока он там пророчил, такие программы во всю тестировались и обучались делать, то что просит пользователь. к сожалению не помню названия.
Нееее. В действительности всё не так как на самом деле :) 5x86 — это не 586, а маркетинг. И 160 в математике не лучше чем 90, а в точности наоборот, ибо в пнях был лучший по тем временам сопроцессор.
Я имел в виду тот факт, что в книге Лукьяненко технология голосового управления стала наряду с интерфейсом командной строки основным средством ввода, чего в жизни, как мы знаем, не случилось.
Вроде цель статьи была показать, что с голосовым управлением всё не так глухо. Ну знаете ли, сравнивая с голосовым управлением в Android, где так же есть полноценное распознавание речи, плюс оффлайновые данные для русского весят всего 20 мегов и ничего не надо треннировать и всё само работает искаропки и работает на железе заведомо слабее PC… Вобщем, Pocketsphinx — это глухо, очень глухо. Я бы сказал — epic fail. Такому проекту просто нет места под Солнцем (: Проекту уже более десяти лет, а он всё ещё в стадии зародыша. Ну уж извините…
Сфинкс программа не для конечного пользователя, а скорее фреймворк для построения этих програм. В этом качестве он успешно используется и для програм на Android & iOS (http://habrahabr.ru/post/170075/ &etc). И для десктопа (в частности Simon, к которому относилось мое замечание, и информацию о котором вы, вероятно не смотрели:) )
Для сфинкса также существует масса уже готовых языковых и акустических моделей, доступных для скачивания с их сайта.
Самостоятельно создание и адаптация предпологается только для спецефических целей.
А чего вы хотите от Сфинкса? Нажать одну кнопку, и чтобы после этого все работало и могло распознать «Войну и мир»? Пишите сами хороший гуй со всеми перделками или смотрите в сторону внезапно подвернувшегося Simon (действительно нужно протестировать).
Вы говорите, что на Андроиде все работает из коробки. Берем Сфинкс, берем готовые модели и словари и работаем, в чем проблема? Другой вопрос в том, что готовые модели и словари могут не устроить пользователя из-за недостатка или несоответствия лексики.
Тренировать не обязательно, это просто позволяет улучшить качество.
А скорость работы — почему вы с такой претензией отнеслись к Сфинксу? Лично вы работали с ним?
Добрый день!
Я пытаюсь запустить pocketsphinx_continuous c созданными мною lm и dic файлами, но программа требует определить еще и hmm или mdef, выдает error. Пытался запускать с уже имеющимися моделями, но у них другие фонемы, и от этого сыплются error-ы. Каким образом можно получить hmm или как обойти эти требования?
Получается, что ru4sphinx делает словарь только для определенной акустической модели? С имеющимися у меня (msu_ru_nsh и wsj1) не работает — так как в словаре оказываются фонемы, которые не используются в этих моделях.
Большое Спасибо за статью уважаемый!
Какую модель посоветуете использовать для распознавания русской речи? Ту что с voxforge? или Вы знаете какой то более полный словарь? В проекте ru4sphinx есть еще какой то словарь приличного размера. Как то можно их объединить для улучшения распознавания?
P.S. Тем у кого при запуске pocketsphinx_continuous, вылетает ошибка:
Failed to calibrate voice activity detection
1) Запишите звуковой файл снова, сделайте в начале паузу 4 секунды а затем уже начинайте диктовать.
2) Попробуйте снова адаптировать акустическую модель под себя
Pocketsphinx. Распознавание речи и голосовое управление в Linux