Всем привет!
Многие знают, что в Windows есть встроенная функция «Распознавание речи», а в новых версиях — «Голосовой ввод» (Win + H). Это неплохие инструменты, но меня в них всегда
смущали несколько моментов: непрозрачность в вопросах приватности, ограниченная кастомизация и глубокая интеграция в систему, которую не всегда удобно настраивать.
Хотелось чего‑то простого, гарантированно оффлайнового и с открытым исходным кодом, чтобы точно знать, как оно работает. Так родилась идея создать Scribe — полностью
автономного и максимально гибкого голосового ассистента.
В основе — приватность, автономность и гибкость
Чтобы обеспечить полную автономность, я выбрал в качестве движка распознавания речи Vosk. Это позволяет Scribe работать со всеми доступными моделями Vosk, а это более 30 языков на выбор пользователя. Все данные обрабатываются локально, не отправляя ни байта за пределы компьютера.
Весь проект написан на Python с использованием фреймворка PyQt5, что обеспечивает совместимость со старыми версиями ОС, включая Windows 7.
Ключевые возможности Scribe
Я постарался реализовать функции, которых мне не хватало в других программах:
Полное управление через глобальные горячие клавиши. Это одна из главных особенностей Scribe. Вы можете настроить системные хоткеи, которые будут работать из любого
приложения, и с их помощью:Запускать и останавливать режим транскрибации.
Активировать режим выполнения команд.
Мгновенно переключать модели распознавания на лету, выбирая нужный язык или точность без входа в меню.
Продвинутые голосовые команды. Вы можете создавать команды для выполнения практически любых действий:
Запуск программ, включая современные UWP-приложения.
Открытие сайтов и файлов.
Выполнение любых комбинаций клавиш (например, «скопировать всё» для Ctrl+A, Ctrl+C).
Механизм нечеткого сравнения. Если вы ошиблись в произношении на одну-две буквы или программа не совсем точно распознала фразу, команда все равно будет выполнена. Это
значительно повышает удобство использования.Два режима ввода текста. Scribe может вводить распознанный текст двумя способами:
Эмуляция клавиатуры: Прямой посимвольный ввод.
Вставка из буфера обмена: Мгновенная вставка всего распознанного текста. Этот способ работает быстрее и создает меньше нагрузки на процессор.
Автозамена (Hotstrings). Позволяет настроить "горячие строки" — короткие ключевые слова, которые Scribe автоматически заменяет на заранее заданный большой кусок текста.
Максимальная кастомизация. В программу встроено множество настроек, позволяющих адаптировать ее под себя: от внешнего вида до тонкой настройки распознавания.
Низкое потребление ресурсов. Программа изначально оптимизирована, чтобы не нагружать систему. Дополнительно в настройках есть опции, позволяющие еще сильнее снизить
нагрузку на "железо".
Установка не требуется
Scribe — это портативное приложение. Достаточно скачать исполняемый файл, положить его в любую новую пустую папку и запустить. Программа сама создаст рядом с собой все
необходимые файлы и каталоги. Никаких записей в реестре и мусора в системе.
Текущая сборка предназначена для Windows x64 (протестировано на Win 7, 8, 8.1, 10 и 11).
Проект открыт для всех
Scribe — это полностью открытый проект, распространяемый под лицензией GPLv3. Я верю в силу сообщества и буду рад любой обратной связи, идеям по улучшению или помощи в
разработке.
Небольшой совет: при выборе моделей Vosk учитывайте, что более легковесные модели загружаются значительно быстрее и требуют меньше ресурсов, но могут уступать в точности
распознавания. Для мощных ПК лучше подойдут более "тяжелые" и точные модели.
Scribe — это инструмент для тех, кто ценит приватность, производительность и полный контроль над своим ПО. Скачивайте, пробуйте и делитесь идеями по развитию проекта.
Полезные ссылки:
Спасибо за внимание! Готов ответить на ваши вопросы в комментариях.