Pull to refresh

Comments 50

Очень круто, спасибо!

К сожалению (или к счастью), не являюсь пользователем windows, поэтому воспользоваться сей крутой разработкой не могу, буду ждать Линукс-версию. ))

По поводу умного дома подсказка: здесь неделю-две назад была статья энтузиаста, который создаёт подобную систему локального управления умным домом без привязки к интернету - его тоже напрягают все эти требования подключать API, ключи и так далее, и у него уже есть более-менее готовое решение. Попробуйте скооперироваться, думаю, процесс сильно ускорится. ;)

Спасибо, за подсказку. А сможете скинуть статью или сразу аккаунт его? Если остался вдруг

тоже присоединюсь к вопросу)

не понятно почему но постоянно отключается, задаю вопрос про погоду работает

если что по сложней выключается и все

а подскажите системные характеристики ваши, и лог ошибки выдает или просто молча выключается?

В общем методом многократного закрывания открывания стало понятно что если задать любой вопрос не по шаблону (типа кто нарисовал картину черный квадрат или напечатать открой маил ру он просто выключается ) если по шаблону вроде работает (

Процессор         Intel(R) Xeon(R) CPU E3-1245 V2 @ 3.40GHz   3.40 GHz

Оперативная память    16,0 ГБ (доступно: 15,7 ГБ)

Память 233 GB SSD Samsung SSD 870 EVO 250GB, 466 GB HDD ST500DM002-1BD142

Тип системы     64-разрядная операционная система, процессор x64

Win10

где исправить что бы она не включалась

интересное замечание, проведу еще раз тесты, спасибо. А подскажите вы установили версию с exe или запускаете через исходники? И установлена ли модель gguf?

просто скачал Vera.zip, запустил Vera.exe

нет не установлено gguf

что то доставить надо ? (просто было написано типо с коробки без бубна :) )

если скачали zip файл, то там сразу gguf версия модели уже предустановлена (Qwen3-1.7B). Возможно проблема будет в отсутствии C++ библиотек (требуются для llama-cpp-python). Попробуйте установить Microsoft Visual C++ Redistributable: https://aka.ms/vc14/vc_redist.x64.exe После установки перезагрузите компьютер. И отпишите, пожалуйста, если так же выключается

как не досадно не помогло (проверю еще на другом компе ) и отпишусь

задумка та классная еще б не вырубалась постоянно или хотя бы после отключения сама врубалась, мож где код поменять ?

Понял вас, проведу заново тестирования, постараюсь разобраться в чем проблема. Перед публикацией само собой проводил тесты на 5-и разных устройствах, проблем не возникало, так что это прям интересную задачу вы дали.

Винды нет, ждем версию для linux/mac)

UFO landed and left these words here

не живем, существуем))

А ей можно сказать, Вера, поотвечай там за меня в телеге? И она поболтает?

Честно, пытаюсь сделать, т.к вопрос для самого актуальный. Возникли определенные трудности (пытался сделать через selenium, но безрезультатно), сейчас пробую сделать через веб версию телеграмма и самописное расширение, полет пока нормальный, но думаю до ума доведу уже после нового года

Всю жизнь мечтал о личном Джарвисе)

Дополнительная сложность, цель простота

Comet может с тг чуть-чуть взаимодействовать через веб

Здравствуйте, очень классная штука. Сам я в программировании ничерта почти не понимаю. Но очень интересует тема локальных голосовых помощников и особенно интеграция с умным домом.

Недавно все видели, к чему приводит вешать умный дом на онлайн сервисы, типо Алисы. По весне как раз буду в дом переезжать и хочу на свой сервер завязать весь умный дом и управлять голосом.

Так, что удачи вам, классный проект !

Спасибо за поддержку! Как раз и стараюсь сделать максимально просто и отзывчиво, чтобы в двух шагах: запустил и пользуешься

Момент. перестала реагировать на голос -скрины выше. Но на печатный запрос - закрыла таки телегу.

при общении голосом перед запросом(командой) говорите Вера: Вера, закрой телеграм. Можете и после запроса. Суть такова, что агент по идее должен работать постоянно в фоне, но если он на каждый ваш диалог будет отвечать - то будет черт пойми что, соответственно, пока базовая логика как у Алисы - говорите Вера и далее ваш запрос. В текстовом режиме можно писать без Вера. Если что вся информация по использованию есть и на сайте Vera Agent и в репозитории tripleguard/agent_vera

Так ностальгия в голову ударила и так Лукьяненко вспомнился... Глубина-глубина, я не твой и все такое

А проект классный, автор, ты крут)

А как агента для написания простого кода микросервисов пойдёт?

честно говоря, как агента для программирования пока не задумывал, может в следуюющих выпусках уже. Можете поэксперементировать, вместо Qwen 3 1.7B попробовать Qwen 2.5 coder 3B. Но тогда думаю и системный промпт чуть переписать.

Клево

Насчет интерфейса, подумай, может удобнее было бы подружить с goose

fyi

Проект однозначно классный! Но с распознаванием проблемы. Например так и не удалось запустить голосом CMD, не всегда верно распознает названия папок. Можно как то в настройках подкрутить точность пусть даже в ущерб скорости (в разумных пределах)?

тут к сожалению проблема уже с самим датасетом vosk, он сам по себе маленький и WER у него составляет в районе 20-25%. Можете вместо маленькой версии vosk, попробовать поставить большую. Рассматриваю и другие варианты, whisper, + недавно вышли новые модели GigaAM, так что думаю буду отходить от vosk.
А по поводу cmd - еще не добавил :) Очень много уже предложений поступило по улучшению функционала, так что на днях выложу чуть улучшенную версию

[ВЫ] вера открой папку бокс на диске и
[FOLDER] Поиск папки: бокс на диске и
[FILE_INDEX] Ошибка Windows Search: (-2147352567, 'Exception occurred.', (0, None, None, None, 0, -2147215328), None)
[Вера] Папка 'бокс на диске и' не найдена.

(E:\Books)

Проще руками написать. Автор, за идею 5. Но чат нужен

а текстовый вариант есть, просто напрямую в терминал пишите, можно без Вера. С файловыми операциями заметил уже много проблем(спасибо читателям), на тестировании не обратил на них внимания, так что в ближайшие день-два обновлю репозиторий

А что вообще происходит - с каких пор ИИ модели не нужна видеокарта?

И не по теме - а есть какая ни будь обученная модель для расшифровки виндовских евентов? Потому как логи ошибок в винде это отдельный вид искусства и их изначально писали на языке ИИ, человеку в этом разобраться нереально.

С момента появления. Видеокарта нужна для ускорения работы. Точно так же как и для графики: Обе классические версии Doom и первые 2 или даже 3 версии Quake прекрасно работали на центральном процессоре. Математика-то никуда не девается.

Замечания — нет обратной связи на сайте для отчетов и пожеланий, я бы сделал форму принятия логов от тестеров, в логах видно все, к примеру открыл я хром, дальше что — как открыть мне вкладку на каком-то пространстве, пролистать текст, вернуть его назад.

Скорость работы на ноуте в 8мб приемлемая, если команда распозналась сразу: Пример лога: [ВЫ] вера погода в петербурга
[WEATHER] Searching: погода петербурга
[SEARCH] Brave: найдено 5 ссылок
[WEATHER] Trying: https://yandex.ru/pogoda/ru/saint-petersburg
[Вера] Погода в Петербурга: 3° пасмурно Ощущается как 1° Советую одеться потеплее.
[ВЫ] погода в петербурга три градуса пасмурно ощущается как один градуса советую одеться потеплее
[ВЫ] мира открой диспетчер задач
[ВЫ] вера открой диспетчер задач
[Вера] Открываю диспетчер задач.
[ВЫ] открываю диспетчер задач
[ВЫ] вера кто такой барыш вторник

Нет понимания будет проект развиваться или нет. По проекту — плохое распознавание голоса, непонимание контекста команды, если Вера не поняла — ей бы следует спросить, что надо сделать. Ну и добавить команду «Вера, СТОП» — когда она начала нести дичь, для немедленной остановки.

В реальной жизни к использованию продукт пока непригоден. А так проект интересный, жду продолжения с новой статьей на хабре.

Дополнительно в лс лог отправил.

По поводу обратной связи, создал тг канал для этого https://t.me/agent_vera_ai. По функционалу все описано в документации на сайте и в readme на гитхабе, но по ходу дела будет обновляться. С веб-браузером пока агент работает минимально, то есть это открытие сайтов по уже вписанным в конфиг, веб-поиск, погода, курсы валют, но в будущем планирую сделать и полное взаимодействие с браузером. На счет распознавания согласен полностью с вами, но пока это самый простой и низкозатратный способ локального STT, пробую с другими STT нейросетями/плагинами, пока засматриваюсь на whisper base/small.
И касательно Вера, стоп - для немедленной остановки, вы можете просто сказать вера, чтобы прервать ее речь. Спасибо огромное за комментарий и обратную связь! Приму к сведению и подправлю.

Попробовал некоторые функции и могу сказать одно — да, это то, что я так долго ждал, что-то около личного Джарвиса, который может управлять твоим компьютером через голосовое управление. Но что точно стоит сделать в ближайшее время: либо обновить инструкцию, либо сделать так, чтобы при ошибке консоль не закрывалась. Нигде не было написано, что путь до папки агента не должен содержать кириллицу, соответственно, портативная версия закрывалась сама без объяснения, пришлось скачивать исходный код, устанавливать все зависимости, кстати, которые не все скачиваются через requirements (как я понял, некоторые зависимости нужно устанавливать с правами админа) и только так в терминале я нашёл ошибку, что путь неверен и в пути вместо кириллицы были нечитаемые символы. А так, в целом, теперь буду следить за обновлениями и ждать новых версий. Если когда-нибудь можно будет через этого агента полностью управлять компьютером, а то ещё хлеще — умным домом, то это будет просто шик)

Спасибо за комментарий, не проверял на кириллице, обязательно проверю и подправлю. Если проект интересен, то попрошу вас подписаться на тг канал https://t.me/agent_vera_ai. Его как раз и создал для обратной связи/пожеланий/отзывов

Автор, ты молодец! Очень хотелось бы, чтобы в таком готовом виде был бы вариант сборки с CUDA (может быть даже с настройкой по объёму видеопамяти), а ещё без прямого доступа к локальным ресурсам и без необходимости начинать запросы с ключевого слова. Зачем: просто болталка для тренировки иностранных языков.

принял, спасибо за обратную связь! Тоже думаю в будущем сделать поддержку CUDA, но пока бросил силы на версии под linux и macOS

Какие новости о проекте ? на сайте не чего не написано тут тоже, есть обновление ?

нет телеграма узнать не могу

тестировал на 5 разных компах на всех если вопрос не по шаблону прога просто отключалась (это печально ) приходится все время перезапускать

да, небольшое обновление уже залито - добавлена поддержка телеграм, то есть можете голосом попросить ответить человеку или написать в беседу, а так же прочитать последние сообщения от конкретного пользователя. И добавлена система модулей - чтение документов и встроенный интерпретатор python для сложных математических задач, генерации пароля и в будущем для генерации кода. Добавлю на сайте блог изменений, прошу прощения, что сразу не сделал

и подскажите, так же скачивали zip архив? И после фраз агент просто отключался или выдает ошибку? В последней версии на сайте чуть подправил этот баг(сам не сталкивался с ним, хотя тестирование проводил уже на 10и устройствах) там прописал код автоперезапуска при непредвиденном отключении

Если скачать архив и запустить ехе, тогда если вопрос не по шаблону прога просто отключалась. А если собрать по вашей инструкции из исходников, а потом запустить ехе, то тогда все работает и агент не закрывается.

Sign up to leave a comment.

Articles