All streams
Search
Write a publication
Pull to refresh
17
0
Руслан @DollaR84

Software Developer

Send message
где можно купить недвижимость apple? за 200 баксов я бы взял =)
У меня старенький Asus Vivobook еще года так 2012 если не ошибаюсь, или около того. Один аудио разъем для гарнитуры, совмещенный наушники с микрофоном.
Тоже видел, но в своих программах делал без этой задержки и все работает прекрасно. Так что думаю вполне норм.
Интересно было почитать, спасибо.
Насчет нажатия программно комбинаций клавиш. Сам использовал pywin32 модуль, а потом как-то попался модуль keyboard. Вроде проще и довольно удобный. Не знаю может есть какие-то недостатки в работе, мне пока не попадалось вроде.
Я не разбираюсь в конфигурации сетевого оборудования, но что касается программирования на python. Почитайте больше материала по нему, например, про менеджер контекста with, например для работы с файлами, списки (list), а еще лучше словари (dict), например для ваших строк идентификации. Они являются итерируемыми объектами и очень удобно ходить по ним в цикле. Для логирования есть удобный модуль logging, ну и т.д. Это так, на первый взгляд из фрагментов в статье. Ну а вообще автоматизация — вещь нужная, и python очень удобный язык для этого. Удачи в развитии скилла.
Описано легко доступно, мне понравилось, все понятно, спасибо.
Тоже как-то пробовал использовать импорт html, правда в несколько более простом виде, без шаблонов. И очень разочаровался, когда узнал, что в firefox для поддержки надо включать специальный флаг :-(. Пришлось отказаться. Не знаю как насчет тупиковой ветки, но в некоторых случаях очень бы хотелось их применить. Но не с такой поддержкой конечно. А вообще про шаблоны было интересно почитать, спасибо.
>>> Ctrl+F4; Ctrl+Tab.
Ctrl+F4 мне кажется не очень удобной комбинацией.
Как по мне так удобнее Ctrl+W с тем же Ctrl+Tab.
Не знал про такую версию. Скачал и быстренько в нем пробежался по данному сайту. Глюков с доступностью и непонятными прыжками как в firefox на первый взгляд не наблюдаются. Буду тестить. Спасибо за наводку =)
Ну у меня вообще еще 4 Гига памяти =).
К сожалению, не соглашусь с вами. Так улучшили ядро, что доступность для экранных дикторов улетела. Пришлось откатываться до 55 версии, последней стабильно работающей, и отключать обновления.
Спорное утверждение. Может поначалу и так, но со временем и постоянным разрастанием кэша, тормоза начинаются все больше и больше. Через некоторое время начинает жутко лагать. После перехода на firefox за ним такого замечено не было.
Да, в таком плане согласен с вами. Конечно удобно когда привычный голос. Ну а для тех у кого нет nvda наверно было бы неплохо таки делать оба варианта. Можно было бы делать какую-то проверку на наличие работающего nvda в системе.
Уточню, что у SAPI можно получить список голосов GetVoices(), а затем для каждого голоса получить имена GetDescription(), и установить голос не по номеру, а по имени. Но оно годиться только если в системе присутствует нужный голос. Если искомого имени не окажется, пускай даже тот же русский, но другой, не тот что вы ищите, тогда конечно не сработает, и в таком случае остаются только записи.
В таком варианте как вы озвучили — то конечно я с вами полностью согласен. У меня просто нет большого набора голосов, а стандартный русский и является по умолчанию. В SAPI можно получить список голосов, но для старта меню на конкретном языке, не зависимо от набора установленных в системе, то конечно с записями наверно наиболее подходящий вариант.
Да, у COM объектов также можно настраивать голос, громкость и скорость напрямую из самой игры. Ну а так в остальном конечно я согласен с вами. Сам пользую windows 10 совместно с NVDA, так как она удобнее встроенного экранного диктора windows. Просто я имел ввиду, что голос доступен отдельно, не зависимо от диктора.
Немного не понял смысл использования nvdaController. Ну для поддержки брайля то понятно, а вот для синтезатора голоса зачем? Разве что для использования встроенного синтезатора eSpeak. Так как при использовании windows SAPI все проще. Голоса синтезатора это просто COM объекты, к которым легко получить доступ практически из любого языка программирования. Я, когда делал голосового помошника, тоже сначала использовал nvdaController, подключая библиотеку к python. А потом подумал, оттуда используется одна функция, которая непосредственно и озвучивает передаваемую фразу. Тогда я чуть больше покопал информацию и напрямую из python подключил COM объект SAPI голоса. Подключение и использование вроде не сложнее, чем подключение и использование dll, по крайней мере в python. Плюс очевиден, работа программы не зависит от NVDA, будет одинаково работать при установленном любом экранном дикторе, и даже без него. Нужны только установленные голоса в самой windows. Не знаю как в более ранних, а начиная с windows 8.1 и windows 10 улучшили поддержку специальных возможностей. В русской версии по умолчанию присутствует русский голос Ирина, довольно качественный.
Ну про более ранние версии windows не скажу, но начиная с версии 8.1 и 10 в поставку windows включен вроде неплохой синтезатор голоса.
В русской версии — это голос Ирина, по крайней мере я ее использовал.
Или у данного синтезатора есть недостатки еще какие?
Ну насчет swig я не знал, может быть. Да я и сейчас не знаю установлен он или нет, никогда не возникал такой вопрос.

И не буду говорить, что я его полностью закончил или все идеально. Я постоянно продолжаю что-то добавлять или изменять, много бывает еще багов нахожу, но постепенно допиливаю потихоньку.
А насчет активационной фразы, так у меня тоже возникли проблемы с ее использованием, я читал документацию про keyphrase, но мне на тот момент не удалось настроить ее порог срабатывания, и я ее оставил до лучших времен, вот думаю скоро снова заняться может быть этой проблемой.
А на данном этапе пока как временное решение я поступил немного по другому.
У меня все команды разделены по разделам, плюс основной раздел, плюс активационная фраза.
Все разделы разделены по разным грамматическим правилам, в том числе фраза для активации представлена также отдельным правилом.
При инициализации я их всех загружаю функцией set_jsgf_file(), с указанными именами, а затем в цикле крутится распознавание, сначала активационного правила. Когда фраза найдена, происходит смена set_search() на основное правило, которое уже ждет распознавание по разделам, ну и так далее. При окончании или отмене, возвращается правило с активационной фразой.
Я конечно согласен, что это костыль тот еще, поэтому и настроен на переделку с применением правильного решения по документации, так как бывают ложные срабатывания, но пока не хватило еще времени и желания дойти до этого. И так потрачено было много времени на эту домашнюю поделку =)
Я тоже написал себе голосового помощника на pocketsphinx.
Через pip устанавливается прекрасно.
Так как я не задавался целью распознавания произвольной речи, поэтому сразу отбросил вариант использования языковой модели.
Использовал исключительно набор грамматических правил JSGF и составил свой ограниченный словарь.
Данная схема позволила получить в итоге:
быструю загрузку;
очень высокую точность распознавания, по-моему. Ошибки бывают, но не очень часто.
И это абсолютно без подстройки к голосу.
Ну и самое главное конечно оффлайн.
Так что считаю sphinx наиболее удачным решением именно для помощника, выполняющего определенные команды, а онлайновые сдк яндекса и гугла хороши для распознавания произвольной речи, но это другой круг задач.

Information

Rating
Does not participate
Location
Одесса, Одесская обл., Украина
Date of birth
Registered
Activity