Настройка не четкого сравнения является опциональной, можно установить точность совпадения на 100% и все ни какого не четного сравнения не будет.
На счет производительности у меня загружена модель vosk-model-ru-0.42 она довольно тяжелая в упакованном виде она весит 1,8 гиг, нагрузка на мой процессор а у меня рязань 5600H 1-2 % ну максимум 3 % иногда бывает, мой ноут бук от использования программы ни когда не гудит.
При том что я понимаю что качество распознавание не идеальное, но мне как для того что б не набирать текст в Gemini CLI вполне хватает.
В приложении вы можете самостоятельно выбрать какую из имеющуюся моделей распознавания Вы хотите использовать там есть модели по 50мбайт, но также есть модели и по несколько гигабайт. В моем приложении только Вы решаете какого размера модель Вам хочется использовать. понятно что чем больше вес модели чем дольше она будет загружаться но и лучшим будет качество распознавания голоса.
PyQt5 был выбран осознано, для запуска на системах начиная с Windows 7, так как там нет "Голосовой ввод" (Voice typing) или "Диктовка Windows" (Windows Dictation) , на Linux программа без доработки не запустится так как в ней используются пакеты Python типа win32 для взаимодействия с клавиатурой и запуска Windows приложений.
Я планирую добавить поддержку Lunix Ubuntu , но под macos есть такое вроде Встроенное голосовое управление macOS: Это функция, которая позволяет управлять компьютером полностью с помощью голоса. Вы можете открывать приложения, перемещать курсор, прокручивать страницы, и многое другое, просто произнося команды. Эта функция также находится в "Системных настройках" > "Доступность" > "Управление голосом". но и это я не знаю я не проверял у меня нет устройств с macOS
Ну если Вы там создадите скрипт который будет форматировать диск C или любой другой, и настроите программу на запуск этого скрипта то да программа его запустит, ну так Вы сами написали этот скрипт и фактически запустили его. Сама по себе программа ни чего не запускает. Код программы открыт и доступен для ознакомления и сборки на своем ПК.
Whisper пробывал сначала с Whisper но там мой ноут ревел как ракета, а с моделями от Vosk после загрузки, ни какой нагрузки на процессор почти не заметно.
Настройка не четкого сравнения является опциональной, можно установить точность совпадения на 100% и все ни какого не четного сравнения не будет.
На счет производительности у меня загружена модель vosk-model-ru-0.42 она довольно тяжелая в упакованном виде она весит 1,8 гиг, нагрузка на мой процессор а у меня рязань 5600H 1-2 % ну максимум 3 % иногда бывает, мой ноут бук от использования программы ни когда не гудит.
При том что я понимаю что качество распознавание не идеальное, но мне как для того что б не набирать текст в Gemini CLI вполне хватает.
В приложении вы можете самостоятельно выбрать какую из имеющуюся моделей распознавания Вы хотите использовать там есть модели по 50мбайт, но также есть модели и по несколько гигабайт. В моем приложении только Вы решаете какого размера модель Вам хочется использовать. понятно что чем больше вес модели чем дольше она будет загружаться но и лучшим будет качество распознавания голоса.
PyQt5 был выбран осознано, для запуска на системах начиная с Windows 7, так как там нет "Голосовой ввод" (Voice typing) или "Диктовка Windows" (Windows Dictation) , на Linux программа без доработки не запустится так как в ней используются пакеты Python типа win32 для взаимодействия с клавиатурой и запуска Windows приложений.
Я планирую добавить поддержку Lunix Ubuntu , но под macos есть такое вроде Встроенное голосовое управление macOS: Это функция, которая позволяет управлять компьютером полностью с помощью голоса. Вы можете открывать приложения, перемещать курсор, прокручивать страницы, и многое другое, просто произнося команды. Эта функция также находится в "Системных настройках" > "Доступность" > "Управление голосом". но и это я не знаю я не проверял у меня нет устройств с macOS
Ну если Вы там создадите скрипт который будет форматировать диск C или любой другой, и настроите программу на запуск этого скрипта то да программа его запустит, ну так Вы сами написали этот скрипт и фактически запустили его. Сама по себе программа ни чего не запускает. Код программы открыт и доступен для ознакомления и сборки на своем ПК.
Заходите в настройки, и там на вкладку General Settings справа будет пункт Interface Language выбираете любой из более чем 30 языков
Whisper пробывал сначала с Whisper но там мой ноут ревел как ракета, а с моделями от Vosk после загрузки, ни какой нагрузки на процессор почти не заметно.