А почему не Яндекс.SpeechKit? У него насколько я помню распознавание русской речи на уровне. Плюс можно выделять из контекста значимые слова, не так давно была статья об этом.
А почему не третий питон? И почему вы выбрали процедурный подход, а не ООП?
Вы используете urllib и curl, хотя можно было бы выбрать что-то одно. А еще проще было бы с requests.
Использование стороннего конвертера тоже кажется странным шагом, а кое-что из импортированного вообще не используется.
С одной стороны хорошо, что вы продвигаете Python на Windows, но с другой стороны в этом случае неплохо было бы добавить больше примеров выполнения различных команд применительно к данной ОС.
Под Linux, кстати, существует большое количество аналогичных программ. Применительно к Google Speech Recognition API и Python могу предложить посмотреть на LiSpeak. К сожалению, у меня не получилось заставить ее работать, но там есть неплохие наработки. В частости я их использовал для программы uspeak на Python 3.
Самое сложное и пока у меня нет идей как реализовать это стартовое событие — ок гугл. После которой и запускается запись на распознование.
Тут явно сервис гугл не подходит ибо не реально и не стоит весь звук в сеть отдавать.
Голосовое управление компьютером и Python