
Комментарии 72
Samsung пункты в меню называются по другому, вроде полет нормальный Добавьте, пожалуйста, распознавание списков (первое, второе, например)
Спасибо за отзыв! По спискам - в новом обновлении 1.0.6 появился свой словарь автозамен. Туда можно вручную добавить правила вроде первое=1., второе=2. - это первый шаг. Полное автоматическое распознавание структуры списков из речи - это уже отдельная задача обработки текста (понимание контекста, что "первое" - это начало пункта, а не порядковое числительное).
В Pro-версии в идеале: нужна LLM-обработка для стилей, форматирования. Это уже более верхний уровень и требует отдельной модели (с локальным запуском таких моделей много сложностей так как нужно топовое железо телефона) поверх распознавания голоса. Могу вам сказать совершенно точно, что через пару лет локальные LLM будут работать в наших телефонах офлайн (эта тема для отдельной статьи на habr).
По меню Samsung - спасибо, у Самсунга своя терминология, постараюсь учесть.
Poco X6 5G с накатанной Lineage OS - всё взлетело и настроилось нормально. Собственно, этот комментарий я и пишу с помощью Говоруна.
Отдельная просьба: озаботьтесь всё-таки и добавьте в Google Play :) Потому что тащить Рустор на телефон не хочется, а из apk обновлять головная боль.
Рекомендую https://github.com/ImranR98/Obtainium
Да я про него знаю, спасибо :) Ещё есть https://codeberg.org/mi6e4ka/openstore. Никак не дойдут руки поставить, хотя уже несколько приложений есть, которым оно надо (либо в Google Play вообще нет, либо недоступны для не-РФ региона). Но когда есть возможность напрямую попросить автора сделать без костылей - почему бы не попросить :)
P.S. Ещё из пожеланий - возможность сделать размер всплывающей кнопки поменьше. Попасть в неё и так несложно, а так она очень уж много места на экране занимает. Неплохо бы дать возможность настроить под себя.
И совсем мелочь - эта кнопка всплывает в том числе при вводе пароля на экране блокировки. Вот там её точно быть не должно. Не то чтобы особо мешает, но любая лишняя сущность на заблокированном телефоне вызывает у меня смутные опасения в плане безопасности...
Ещё из пожеланий - возможность сделать размер всплывающей кнопки поменьше.
Вот это оперативность :) Прилетела версия 1.0.4 с этой настройкой. Спасибо!
Спасибо за отзыв, cправедливое замечание.
Чтобы сразу снять любые сомнения: ни сейчас, ни раньше Говорун не считывает информацию с экрана - кнопка там просто мозолила глаз без пользы. Раз концептуально ей там делать нечего, проще убрать совсем (в следующем обновлении 1.05 будет сделано)
Само разрешение «специальных возможностей» открывает системный API, который позволяет читать содержимое окон - поэтому Android и показывает большое предупреждение при включении. Это значит что не все приложения с такими возможностями безопасны.
Попробовал ваше приложение. Говорун крутой! Спасибо 😀. Реально полезная штучка.
Чтобы сразу снять любые сомнения: ни сейчас, ни раньше Говорун не считывает информацию с экрана
Да упаси Господи, я не Ваше приложение в чём-то подозревал, а скорее опасаюсь, что сам факт наличия доступного без разблокировки приложения, имеющего специальные права, может быть каким-то образом использовано в качестве вектора атаки. Впрочем, это чисто умозрительно, в матчасти я не настолько силён, чтобы подробнее проанализировать, - но по умолчанию включается паранойя :)
Вижу, что прилетело новое обновление, в котором Говорун на экран блокировки уже не покушается. Спасибо!
Если долго диктовать и долго писать текс, сколько будет потребеление RAM в пике и в среднем?

Рабочий режим: 530 МБ
Если системе нужна память(открыли игру/тяжёлое приложение): Android сжимает в ZRAM, реальный расход падает до 140 МБ — там и держится, пока приложение снова не понадобится. Сейчас проверил еще раз, после ночи простоя — ZRAM (RSS 124 МБ, SWAP 362 МБ)
Сравнение на том же телефоне: Gboard 267 МБ, Pixel Launcher 275 МБ, Яндекс.Клавиатура 393МБ
Вы дали ссылки на лайт. Я так понимаю есть не лайт? Если да в чем разница?
Я так понял, что это некорректный суффикс. По смыслу больше подошло бы, что-то типа «small», «mini», «tiny». Так-то «лайт» воспринимается как «урезанная» по отношению к основной.
upd: о наличии «про» версии не знал, думал «лайт» единственная…
Lite - это и есть основная цель проекта. Сделать наконец нормальный голосовой ввод на русском, выложить в RuStore, чтобы человек просто поставил и пользовался, без заморочек с очередным неработающим решением или подпиской за скромные 12 баксов в месяц, которые ещё надо как-то оплатить через неработающий Google Play. Обидно что для английского куча всего, а для русского толком ничего - вот эта боль и определила судьбу приложения. Pro - это отдельная история - другой продукт для тех кто хочет голосом организовать свои рабочие процессы: создание заметок, постановка задач, добавление в календарь, диктофон с распознаванием. Часть этих сценариев требует LLM-обработки текста - локальная LLM на телефоне это тема для отдельной статьи. Pro не для всех - это нормально, оно и не должно быть для всех. Планирую написать про Pro отдельную статью.
У Gboard сейчас лучший свайп
Всё ещё хуже винфоновского. А ведь прошло больше 10 лет
Не смог установить на Xiaomi 12T Pro, Android 15, HyperOS 3.0.2.0. Установку из неизвестных источников разрешил. Предупреждение Play Protect принял.
Приложение не установлено

Автор ! Ты молодец, по замыслу великолепно!
Реализация: Xiaomi 12, установилась, в инсталлятора есть тест работы - работало.
Птичка справа, не реагирует на нажатие.
Перемещается, в настройках указано что работает.
Все галочки в настройках (в меру моего понимания) установлены, но, говорун в настройках говорит включите быстрый запуск, но я его включил (смайлик недоумения).
(Предложение - в настройки добавить постоянное окно с текстом для ввода голосом.
Спасибо что попробовали. Осталось еще чуть-чуть настроить )
Нужно ВЫключить быстрый запуск (на главном так и написано) и оставить только верхнюю галочку - саму службу. Если включить быстрый запуск то сама эта кнопка будет ломать/выключать службу. Это пока сама большая боль при настройке приложения . Онбординг несколько раз приходилось менять так как модераторы Rustore не могли справиться с установкой. Если ставить через apk проблем еще больше. Других вариантов, кроме как вдумчиво, читать инструкцию и сделать все по пунктам просто нет. Слишком костыльный метод.
Honor Magic 7 Pro, версия с гитхаб, полёт нормальный. Не стал устанавливать с Rustor, поскольку для этого надо установить ещё сам Rustor. Глюков не замечено, разве что включил вибрацию на клавиатуре при редактировании текста, хотя вибрация, изначально, выключена. Замечено один раз, пока. Работу в фоновом режиме не разрешал, проблем пока не замечено. Проблем с установкой, так же, не замечено, не хотели предоставляться разрешения, но, опять же, гугл в предупреждении сказал, куда, лезть, чтобы их предоставить, раз уж пользователь сам себе злобный Буратино. По набору текста. Если уже что-то написано и в этот момент, перейти на речевой набор Говорун начинает с заглавной буквы. Это не критично, хуже со знаками препинания. Например? А вот. "?" - это голосовой набор gmai!Кавычки, вопросительный знак кавычки. Это говорун, восклицательный знак. Не знаю, пользуется ли ими кто-то при голосовом наборе, но хотелось бы иметь возможность) Не очень хорошо распознаёт иностранные слова. Например, Джимайл. В отличие от того же gmail. Отзыв набран в основном с помощью говоруна. И небольшом участии голосового набора gmail. Некоторые ошибки были отредактированы вручную.
Cпасибо за такой подробный отзыв! Про иностранные слова - модель GigaAM обучалась в основном на русском, английский знает только те слова что попадали в её обучающие данные, плюс качество зависит от акцента произношения. Добавил словарь автозамен в новом 1.0.6 - правила вроде "джимэйл=Gmail" или "вопросительный знак=?". В планах для Pro есть постобработка текста при помощи LLM, буду тестировать на своем Pixel 10.
Honor Magic 8 Pro - MagicOS 10 - не работает. :(
Все указания при установке выполнил, говорит `Всё готово`
Птичка появляется у поля ввода, но при нажатии на нее птичка исчезает, в верхней панели появляется зеленый микрофончик, через пару секунд он тоже исчезает, на этом все.
Скорее всего у вас включён "Быстрый запуск" в Спец. возможностях. Если он включен, рядом с птичкой Говоруна появляется второй маленький значок (это системная функция Android), и нажатие по нему выключает Говорун. Проверьте: Настройки - Спец. возможности - Быстрый запуск - выключить (включен должен быть только верхний тумблер самой службы).
Возвращаюсь к вашему отзыву. После него накопились похожие симптомы (птичка появляется и сразу пропадает) с других устройств на Snapdragon 8 Elite Gen 5 - OnePlus 15, iQOO 15. Honor Magic 8 Pro как раз на этом же чипе. Возможно, это из-за бага в библиотеке распознавания - sherpa-onnx с ONNX Runtime 1.23.2 имел баг с детекцией SME-инструкций на новых ARM-чипах. В новой версии библиотеки (ONNX Runtime 1.24.3) это исправлено. Подготовил тестовую сборку: https://github.com/amidexe/govorun-lite/releases/tag/v1.0.7-rc1-onnx
Если попробуете - буду благодарен за фидбек, помогло ли. APK подписан тем же сертификатом, обновится поверх установленной из RuStore.
Поставил на дешевый Infinix Note 30 с процессором G99.
По первому впечатлению - работает хорошо. Проблем пока не обнаружил.
Галакси S25 Ultra. Всё работает. Но пришлось немножко пободаться с разрешениями.
Чем не устраивает говорилка Microsoft Swift она же ничем не хуже того же говоруна, хотя иногда бывает проблемы То что окончание проглатывает но со скоростью никаких проблем нет разве что мысли не так быстро приходят
Спасибо, работает хорошо!
Было бы, круто иметь возможность расшифровки аудиофайлов!
Вы могли бы добавить возможность донатов на развитие проекта
Спасибо за отзыв и за идею! Лучшая поддержка проекта - оценка в RuStore/Github и рассказать о приложении другим. Если оно работает для вас, скорее всего и для других будет полезно!
Сама базовая возможность "голосовой ввод на русском" должна быть в любом Android из коробки, просто производители как обычно тормозят. Pro будет уже про другое - реальные сценарии под рабочие процессы: заметки голосом, задачи, события в календарь, диктофон. На тестовой версии Pixel 8a распознал 60 минут аудио за 14 минут - примерно в 7 раз медленнее чем через облачные сервера, но зато локально. По сути Lite остаётся легкой и доступной версией для всех, а Pro будет отдельным проектом .
После дня использования заметил ещё один недостаток. Если делать в речи паузы, например, задумавшись, как продолжить фразу, то Говорун начинает новое предложение с большой буквы (причём точку то ставит, то нет, а большая буква всегда), - даже если по смыслу оно там совершенно неуместно. И расстановка знаков препинания в этом случае оказывается далека от правил грамматики. Не знаю, конечно, насколько это можно решить на уровне приложения, а не модели.
Вот для примера диктую это. Предложение с несколькими паузами для того Чтобы показать эффект. Очень удачно получилось, что оба Случая и с точкой, и без показаны.
P.S. Нет, дело всё-таки явно не в модели. С ровно той же GigaAM на десктопе (через приложение Handy) любые паузы в речи отрабатывает корректно, не добавляя лишних заглавных и точек.
Спасибо за подробный отзыв! В приложении два режима. В обычном (тап по птичке) приложение разбивает речь на части по паузам, и каждая часть уходит в GigaAM как отдельная фраза. Есть второй режим, если зажать птичку и говорить целиком - вся речь уйдёт в GigaAM одним блоком, и она сама разберётся где границы предложений, а где просто пауза для раздумий. Это, кстати, и объясняет разницу с Handy на десктопе - там, видимо, такой же подход. Можно ещё третий вариант: тап-тап без разбиения на паузах, НО текст появится только после второго тапа. Можно рассмотреть как опцию если будет интерес.
Спасибо за пояснение, наличие второго режима было сходу неочевидно. Handy, да, распознаёт при зажатом сочетании клавиш и вставляет текст только после того, как их отпустить, - но на десктопе куда удобнее держать нажатые клавиши на клавиатуре и при этом говорить, чем на телефоне. Возможно, третий режим и был бы полезен. Отображение текста по мере набора лично для меня не критично.
TCL, Android 15 - все работает. Неплохо распознает литературную речь. Но реальные тексты, которые приходится вводить - каждое второе слово мимо ( Возможность дообучать модель на своем лексиконе - это очень сложно, думаю.
Спасибо за отзыв! Дообучить модель под конкретный лексикон - действительно сложно: нужны датасеты, GPU, недели работы. В версии 1.0.6 появился свой словарь автозамен. В Настройках "Свой словарь" можно вручную добавить часто встречающиеся слова из вашего лексикона: правила вроде "как слышит модель = правильно". Можно попробовать сгенерировать словарь в нейронке. В планах для Pro - ИИ-постобработка распознанного текста.
Полный восторг. Это сообщение диктую через Говоруна и просто кайфую от того, как всё работает.
Один вопрос, который остаётся у меня - подскажите, пожалуйста, насколько большие кусочки текста говорун может обрабатывать. Вижу, что текст появляется по мере речи в моменты каких-то пауз или окончания предложений. Это означает, что он уже обработал какую-то часть и дальше переходит к новой. Правильно ли я делаю из этого вывод, что в целом я могу надиктовать несколько страниц в Google Doc или ещё где-нибудь в заметке и Говорун справится с этой задачей?
Я доберусь и сам, но может быть просто исходя из архитектуры есть понимание что через 10 или 30 минут мой телефон должен расплавиться?)
Спасибо за такой отзыв, очень приятно! Архитектурно ограничений на длительность нет. Каждый кусочек после паузы уходит на распознавание, аудио из памяти очищается, состояние стабильное. Память не накапливается. Можете диктовать хоть несколько страниц подряд. Для ориентира: в Pro есть функция распознавания загруженных аудиофайлов, я тестировал на 60-минутной записи на Pixel 8a - заняло около 14 минут. То есть само распознавание идёт быстрее реального времени. Похоже на нагрузку при видеозвонке - телефон будет тёплый, но не перегреется. За час диктовки батарея сядет заметно, но не критично.
В общем у меня иконка прижилась на экране, часть голосовушек попала необходимость записывать.
Не понял где купить про версию (отзыв оставил). Из идей - в LazyTyper видел настройки, которые позволяют сразу ещё небольшой промпт применить к тексту, он может стать чуть более официальным или неформальным. Не знаю реально ли это тут, просто делюсь.
Ну и английские термины у меня распознает нормально, но у меня они не очень часто бывают. Даже весьма специфичные слова распознает очень хорошо. Мелкие правки нужны, ну так и клавиатура на месте и можно поправить. Короче реально кайф, спасибо за такое приложение. Перепробовал целую кучу, ваше вне конкуренции для андроида.
Стиль-промпты как в LazyTyper - это и есть планируемая Pro-фича. LLM-обработка распознанного текста - шаблоны стилей ("деловое письмо", "сообщение в чат" и т.п.). Это естественное дополнение к распознаванию. Модели, которые хотелось бы использовать, пока работают, к сожалению, слишком медленно на телефоне и требуют от 2.5gb ram, так что в данный момент это только облачный вариант. Точно одно: на горизонте от года до двух всё, что можно придумать по обработке текста, можно будет выполнять локально на телефоне без интернета. Говорун - пример этого направления.
Огонь, жду. Понимаю, что будет облако, грустно немного, но переживу.
И да, очень согласен, что судя по всему, в не сильно далёкой перспективе, мы получим локальные модели на телефонах, причем достаточно быстрые для нормальной работы.
Аппл взял руководителем чувака который занимался процессорами М серий и заключает контракт с Гуглом про их гемини. Явно с прицелом на работу локально.
Гугл активно форсит тему быстродействия. Пока без особых результатов, но старается. Как минимум по скорости ответа гемини и гемма хороши.
ДипСик выпускает супер экономичную в рантайме модель на уровне флагманов, но х10 дешевле (ещё не хватит для мобил, но движение явное)
Квен выпускает аналогичную историю у себя, причем целятся в работу без нвидиа под капотом.
Яндекс уже давно для своей модели бахнул офигенно экономичную токенизацию для русского языка на своих моделях
Короче судя по новостям последних недель:
Халява кончается, все поняли, что работа ии это пипец как дорого
Все хотят сделать процесс дешевле, пока кроме китайцев особых успехов нет, если последние преуспеют - можем получить ИИ встроенный в часы )))
С английским, конечно, печально. Планируете добавить поддержку английского?
Спасибо за отзыв! Для нормального распознавания английского нужна другая модель. Английская модель хорошо распознаёт английский, русская хорошо распознаёт русский. Если взять универсальную, которая работает со всеми языками сразу - она хуже справится и с русским, и с английским по сравнению со специализированными. В Pro-версии можно будет опционально подключить Parakeet от NVIDIA - 25 европейских языков (русский, английский, украинский, немецкий, французский, итальянский и другие). Это для тех кто реально много говорит не на русском. Модель тяжелее (600 МБ против 300 МБ у текущей GigaAM), поэтому будет именно опцией - кому нужно, тот включит. В Lite для английских слов можно использовать свой словарь автозамен (добавил в 1.0.6). Туда можно добавить слова в виде "как слышит модель = правильно", например "джимэйл=Gmail".
OnePlus 15 - не работает. Долго тыкал переключатели спец.возможностей, пока приложение не согласилось работать. У меня пункты меню названы не так, как в карточке-подсказке в приложении.
Сейчас при нажатии по полю ввода появляется птичка, при удержании запускается микрофон. Но текст не появляется.
Спасибо что отписались. На OnePlus accessibility-сервис явно работает со своими нюансами - вы сами заметили что пункты меню называются по-другому. У меня OnePlus нет, к сожалению, потестировать не могу. Кстати, у вас первый отзыв с OnePlus. Если появятся другие репорты по вашей модели - напишу здесь.
По репортам с OnePlus 15, OnePlus 15R, iQOO 15 (и других на Snapdragon 8 Elite Gen 5) приложение крэшится из-за известного бага в библиотеке распознавания. Уже исправлено в новой версии библиотеки.Тестовая сборка: https://github.com/amidexe/govorun-lite/releases/tag/v1.0.7-rc1-onnxЕсли у вас крэш на этих устройствах - попробуйте, пожалуйста. Сообщите помог ли фикс. Если работает - выложу обновление в RuStore.
Установил APK, и всё начало работать. Э-э, не знаю, так ли должно оно работать, как работает. То есть, пока я диктую текст, на экране ничего не появляется. Отпускаю кнопку, и полностью весь текст набран.
Спасибо за приложение!
Самсунг гелакси А13. Судя по всему 32 битный проц. А для говоруна нужна 64? Случайно нет в планах адаптировать на более слабые модели?
Скорее всего у вас 64-битный процессор - все варианты A13 были на 64-битах, тут проблем быть не должно. Уточните пожалуйста версию Android - Говоруну нужен 13 или новее. И сколько у вас ОЗУ - если 3 ГБ может быть впритык, на 4 ГБ+ возможно заработает. Самый простой вариант - попробуйте поставить из RuStore и напишите что получилось.
загнал ошибку из cmd в дип сик и скрин с телефона о системе, он мне выдал следующее
Модель устройства: Samsung SM-A135F
Версия Android: 14 (One UI 6.0)
Версия ядра: 4.19.198-27972583-abA135FXXU5DXA2
Номер сборки: UP1A.231005.007.A135FXXU5DXA2
Статус SE для Android: Enforcing
Версия Knox: 3.10 (API level 37)
Версия ПО безопасности: ASKS v7.5 Release 20260111, ADP v3.1 Release 20230510, SMR Nov-2023 Release 1
Уровень безопасности Android: 1 ноября 2023 г.
Команда установки и ошибка:
bash
adb install --bypass-low-target-sdk-block "govorun-lite-1.0.6.apk"Результат:
text
adb.exe: failed to install govorun-lite-1.0.6.apk: Failure [INSTALL_FAILED_NO_MATCHING_ABIS: INSTALL_FAILED_NO_MATCHING_ABIS: Failed to extract native libraries, res=-113]Что нужно знать разработчику:
Ошибка INSTALL_FAILED_NO_MATCHING_ABIS означает, что в APK-файле отсутствуют нативные библиотеки (*.so), совместимые с архитектурой процессора этого устройства.
Устройство SM-A135F (Galaxy A13) имеет процессор на архитектуре armeabi-v7a (32-bit). Для корректной установки необходимо, чтобы APK содержал библиотеки в папке lib/armeabi-v7a или был собран как Universal APK (с поддержкой всех архитектур).
Текущая версия govorun-lite-1.0.6.apk, судя по ошибке, вероятно, содержит только 64-битные библиотеки (arm64-v8a), что несовместимо с данным устройством.
И еще немного
Проверить настройки сборки (Если вы разработчик)
Если это ваше собственное приложение, то при сборке в Android Studio или другом инструменте нужно включить поддержкуarmeabi-v7aв списокabiFiltersв файлеbuild.gradle:gradle
android { defaultConfig { ndk { abiFilters 'armeabi-v7a', 'arm64-v8a' } } }
Вывод
Ваш телефон 32-битный (armeabi-v7a), а приложение govorun-lite (версия 1.0.6) — 64-битное (arm64-v8a). Найдите версию приложения, которая поддерживает 32-битные устройства, и установка пройдет успешно.
Точно, 32-битная ОС, несмотря на возможности процессора (64). На текущий момент «Говорун» оптимизирован только под 64-битные системы (arm64-v8a).
Разработка 32-битной версии пока не планируется, так как алгоритмы распознавания речи требуют высокой производительности, приложение будет работать слишком медленно, что может испортить впечатление от использования.
Оставлю свой порт для iOS: https://github.com/polRk/SileroVADKit
Samsung Galaxy S25, работает без проблем, спасибо!
Спасибо, действительно, все работает. Но на телефоне мне было этого мало, поэтому с помощью вашего проекта я сделал себе Govorun'a и на PC. ))
Есть собранный для винды? Тоже бы не отказался от такого на РС
https://github.com/NoWor1989/Govorun-PC Да, без проблем, держи, ну только это так чисто для себя делал, не суди строго.
Poco x6. Установился, но при настройке, когда нужно дать разрешение открывается страница настроек, где нет ничего про голосовой ввод. Пролез все пункты - нет голосовых настроек. В итоге просто пошел в приложение "настройки", нашел голосовой ввод и включил ему разрешение.
Работает отлично👍
OnePlus 13 Global - всё работает отлично, родную речь распознает замечательно, супер приложение! Наконец то можно удалить Wisp Flow, респект и уважуха создателю. Написал небольшой пост у себя в ТГ канале.
Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3