Есть, это называется «Максимальный уровень сигнала для начала записи» и «Кол. срабатываний на макс. уровень» и рядом с ними галка для активации режима.
То есть работает режим так: постоянно анализируется уровень сигнала с микрофона, как только он превысит порог N раз, то начинается запись, как только уровень опуститься ниже минимума M раз, запись прекратиться и данные улетят в Google для распознавания.
Но постоянный поиск — это постоянная отправка запросов в Google и некоторые задержки в приеме команд, т.к. все делается в один поток. Как бы Google не обиделся при большом потоке шелухи.
я бы предложил ещё добавить сюда ключевую фразу для активации. т.е. что б можно иметь что-то вроде диалога: -компьютер; — слушаю; — включи музыку. для распознания ключевой фразы можно использовать встроенную в windows7 систему распознавания, ну или что-то простенькое своё, если есть такая возможность.
>>Пробовал сделать похожу программу — получилась такая штука: youtu.be/zNIlF-dxn-s
Это скорее аналог Siri для PC, у меня же это программ для управления компьютером в чистом виде.
>>ключевую фразу для активации. т.е. что б можно иметь что-то вроде диалога: -компьютер; — слушаю; — включи музыку. для распознания ключевой фразы можно использовать встроенную в windows7 систему распознавания, ну или что-то простенькое своё, если есть такая возможность.
С этим как раз есть сложности, свой алгоритм распознавания изобретать очень трудоемко, для этого есть специализированные аппаратные решения, которые как раз и использует Google.
Насколько я знаю, встроенная в Windows система распознавания не поддерживает русский язык.
>>Оказывается я не один над подобной программой работаю
>>Вот так работает моя программа
Мой проект несколько иной, у меня не стоит задача создания ИИ на основе нейронных сетей или чего то подобного. Я просто управляю компьютером посредством голосовых команд, логика тут жесткая, никакой полемики с компьютером я не веду, дана команда, если она распознана, то выполняется какое-то действие.
Программа интересна. Хотел увидеть исходники, но, к сожалению, не нашёл их. Там только скомпиленные проекты.
Если можно и не жалко просьба выкинуть исходники :-)
Использование Google Speech API для управления компьютером