Комментарии 12
Режима постояннного поиска команд нету? :-[
0
Есть, это называется «Максимальный уровень сигнала для начала записи» и «Кол. срабатываний на макс. уровень» и рядом с ними галка для активации режима.
То есть работает режим так: постоянно анализируется уровень сигнала с микрофона, как только он превысит порог N раз, то начинается запись, как только уровень опуститься ниже минимума M раз, запись прекратиться и данные улетят в Google для распознавания.
Но постоянный поиск — это постоянная отправка запросов в Google и некоторые задержки в приеме команд, т.к. все делается в один поток. Как бы Google не обиделся при большом потоке шелухи.
То есть работает режим так: постоянно анализируется уровень сигнала с микрофона, как только он превысит порог N раз, то начинается запись, как только уровень опуститься ниже минимума M раз, запись прекратиться и данные улетят в Google для распознавания.
Но постоянный поиск — это постоянная отправка запросов в Google и некоторые задержки в приеме команд, т.к. все делается в один поток. Как бы Google не обиделся при большом потоке шелухи.
0
Пробовал сделать похожу программу — получилась такая штука: youtu.be/zNIlF-dxn-s
А вообще в Anodrid 4.0+ есть «непрерывное» распознавание речи. Если бы его использовать для распознавания, то проблемы с активацией не было бы.
А вообще в Anodrid 4.0+ есть «непрерывное» распознавание речи. Если бы его использовать для распознавания, то проблемы с активацией не было бы.
+1
я бы предложил ещё добавить сюда ключевую фразу для активации. т.е. что б можно иметь что-то вроде диалога: -компьютер; — слушаю; — включи музыку. для распознания ключевой фразы можно использовать встроенную в windows7 систему распознавания, ну или что-то простенькое своё, если есть такая возможность.
0
>>Пробовал сделать похожу программу — получилась такая штука: youtu.be/zNIlF-dxn-s
Это скорее аналог Siri для PC, у меня же это программ для управления компьютером в чистом виде.
>>ключевую фразу для активации. т.е. что б можно иметь что-то вроде диалога: -компьютер; — слушаю; — включи музыку. для распознания ключевой фразы можно использовать встроенную в windows7 систему распознавания, ну или что-то простенькое своё, если есть такая возможность.
С этим как раз есть сложности, свой алгоритм распознавания изобретать очень трудоемко, для этого есть специализированные аппаратные решения, которые как раз и использует Google.
Насколько я знаю, встроенная в Windows система распознавания не поддерживает русский язык.
Это скорее аналог Siri для PC, у меня же это программ для управления компьютером в чистом виде.
>>ключевую фразу для активации. т.е. что б можно иметь что-то вроде диалога: -компьютер; — слушаю; — включи музыку. для распознания ключевой фразы можно использовать встроенную в windows7 систему распознавания, ну или что-то простенькое своё, если есть такая возможность.
С этим как раз есть сложности, свой алгоритм распознавания изобретать очень трудоемко, для этого есть специализированные аппаратные решения, которые как раз и использует Google.
Насколько я знаю, встроенная в Windows система распознавания не поддерживает русский язык.
0
>>> А вообще в Anodrid 4.0+ есть «непрерывное» распознавание речи. Если бы его использовать для распознавания, то проблемы с активацией не было бы.
Нужно поковыряться, что там придумали на этот счет. Возможно они используют возможности DSP процессора телефона, на обычном PC такое сложно сделать.
Нужно поковыряться, что там придумали на этот счет. Возможно они используют возможности DSP процессора телефона, на обычном PC такое сложно сделать.
0
Оказывается я не один над подобной программой работаю
Вот так работает моя программа
Вот так работает моя программа
0
>>Оказывается я не один над подобной программой работаю
>>Вот так работает моя программа
Мой проект несколько иной, у меня не стоит задача создания ИИ на основе нейронных сетей или чего то подобного. Я просто управляю компьютером посредством голосовых команд, логика тут жесткая, никакой полемики с компьютером я не веду, дана команда, если она распознана, то выполняется какое-то действие.
>>Вот так работает моя программа
Мой проект несколько иной, у меня не стоит задача создания ИИ на основе нейронных сетей или чего то подобного. Я просто управляю компьютером посредством голосовых команд, логика тут жесткая, никакой полемики с компьютером я не веду, дана команда, если она распознана, то выполняется какое-то действие.
0
Можем попробовать объединить усилия, если интересно, то черкни в аську 161867489
0
Программа интересна. Хотел увидеть исходники, но, к сожалению, не нашёл их. Там только скомпиленные проекты.
Если можно и не жалко просьба выкинуть исходники :-)
Если можно и не жалко просьба выкинуть исходники :-)
0
Исходники в репозитарии code.google.com/p/mspeech/source/browse/#svn%2Ftrunk
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Использование Google Speech API для управления компьютером