Обновить
5
0
Слава@AIgrator

Пользователь

Отправить сообщение

да у меня все работает на ноуте ryzeh 5600H , 16  ГБ ОЗУ , RTX 3060 с 6 ГБ VRAM ,

ну естественно чем мощнее железо тем быстрее omniParser сможет делать визуальный анализ вашего экрана если Вы будете использовать визуальный режим

Настройка не четкого сравнения является опциональной, можно установить точность совпадения на 100% и все ни какого не четного сравнения не будет.

На счет производительности у меня загружена модель vosk-model-ru-0.42 она довольно тяжелая в упакованном виде она весит 1,8 гиг, нагрузка на мой процессор а у меня рязань 5600H 1-2 % ну максимум 3 % иногда бывает, мой ноут бук от использования программы ни когда не гудит.

При том что я понимаю что качество распознавание не идеальное, но мне как для того что б не набирать текст в Gemini CLI вполне хватает.

В приложении вы можете самостоятельно выбрать какую из имеющуюся моделей распознавания Вы хотите использовать там есть модели по 50мбайт, но также есть модели и по несколько гигабайт. В моем приложении только Вы решаете какого размера модель Вам хочется использовать. понятно что чем больше вес модели чем дольше она будет загружаться но и лучшим будет качество распознавания голоса.

PyQt5 был выбран осознано, для запуска на системах начиная с Windows 7, так как там нет "Голосовой ввод" (Voice typing) или "Диктовка Windows" (Windows Dictation) , на Linux программа без доработки не запустится так как в ней используются пакеты Python типа win32 для взаимодействия с клавиатурой и запуска Windows приложений.

Я планирую добавить поддержку Lunix Ubuntu , но под macos  есть такое вроде Встроенное голосовое управление macOS: Это функция, которая позволяет управлять компьютером полностью с помощью голоса. Вы можете открывать приложения, перемещать курсор, прокручивать страницы, и многое другое, просто произнося команды. Эта функция также находится в "Системных настройках" > "Доступность" > "Управление голосом". но и это я не знаю я не проверял у меня нет устройств с macOS

Ну если Вы там создадите скрипт который будет форматировать диск C или любой другой, и настроите программу на запуск этого скрипта то да программа его запустит, ну так Вы сами написали этот скрипт и фактически запустили его. Сама по себе программа ни чего не запускает. Код программы открыт и доступен для ознакомления и сборки на своем ПК.

Заходите в настройки, и там на вкладку General Settings справа будет пункт Interface Language выбираете любой из более чем 30 языков

Whisper пробывал сначала с Whisper но там мой ноут ревел как ракета, а с моделями от Vosk после загрузки, ни какой нагрузки на процессор почти не заметно.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Десктоп разработчик, Фулстек разработчик
Python
PHP
MySQL