Search
Write a publication
Pull to refresh

Comments 31

Вышла 12 версия русского опенсорс голосового помощника Ирина (900+ звезд Гитхаб)

Простите но заголовок выглядит как "горячий одинокий голосовой помощник, жаждет общения, в 3 км от вас. Жми что бы познакомиться", ну а поделу, нечего сказать, хоть дома и две Алисы, сам не пользуюсь особо. А вот она тригеррится на имя кошки "ирис"...

Простите но заголовок выглядит как "горячий одинокий голосовой помощник, жаждет общения, в 3 км от вас. Жми что бы познакомиться"

А вы другие заголовки на Хабре видели? ))))

А вы другие заголовки на Хабре видели? ))))

Вот это точно! Честно, уже прямо подмывает накатать для 1 апреля что-нибудь с заголовком типа "Проспал, плюхнулся в кресло рядом с кроватью, слушал новости и музыку и заработал шесть миллионов". :)

А то и: "Объелся резиновых мишек, обделался не добежав до туалета, теперь зарабатываю миллиарды на ортопедических креслоунитазах".

P.S. Спасибо за публикацию.

Подскажите на голом Андроид можно запустить распознавание речи, используя ваш проект. Мне нужно на головном устройстве авто реализовать голосового ассистента.

Вроде да, но смотрите документацию по VOSK STT и TTS - я к Андроид реализации отношения не имею.

Когда потребуется что-нибудь отменять :-)
"Галя, у нас отмена!"

Ларису Ивановну хочу 😄😁

Не увидел требований к железу…

При запуске в автономном рекомендуемом варианте (VOSK STT + VOSK TTS) нужно чуть меньше 1 Гб оперативки (около 900 Мб). По процессору затрудняюсь сказать, что-то недостаточно медленное нужно. На ноуте 2013 года работает без особых проблем.

Если только STT + RHVoice, то нужно около 500-600 Мб наверное.

В других вариантах можно все вынести в облако (тогда почти ничего не нужно) или, наоборот, загрузить машину по "не балуйся".

Голосовой помощник на винде, независимо от качества исполнения, видится менее полезным нуждающейся в постоянном интернете колонки. Даже home assistant предлагает разной степени кривости решения этой задачи на железе микрокомпьютеров. Было бы интересно на уровне микроконтроллеров, но доступные из них слишком слабы для такой задачи. Может потому частично оффлайновые колонки так дороги пока.

Уже появляются мощные микроконтроллеры, типа esp32-p4. Там даже какие-то ai-инструкции есть

Ирина, ну *б твою мать! наконец-то так можно разговаривать с компьютером))

Подскажите пожалуйста варианты железа которое можно использовать для работы с Ириной. Имею в виду массивы микрофонов в компактном корпусе с шумозащитой

Не знаю, я не по железу.

Нет, неверно. tools - это механизм, позволяющий спрашивать ЛЛМ, какую функцию вызвать. MCP является известным механизмом, опирающимся на tools и позволяющим подключать конкретные разные инструменты для деклараций tools и их обработки.

MCP является более конкретным, и, честно, говоря, более сложным и тяжелым в настройке способом решать проблемы. tools сами по себе более простые, и используются именно они.

Здравствуйте Уважаемый. Запускаю Ирину через докер. У Вас в Гитхабе написано, что при первом запуске, папка options заполнится файлами и можно будет их редактировать. Но ничего такого не происходит. Папка пустая. Посмотрел внутри докера по пути /home/python/irene/options тоже пусто. Что не так? Еще там же, в папку плагинов Вы советуете положить плагин silero_v3 из plugins_inactive. Но в папке plugins_inactive на Гитхабе нет такого файла. Где его искать?

Еще вопрос пожалуйста. Можно ли сделать так, чтобы web клиент позволял подключаться по http, не по https? Заранее спасибо.

Добрый день!
Я Докер уже не поддерживаю, устал (там очень старая), рекомендую брать версию от автора в комьюнити https://github.com/janvarev/Irene-Voice-Assistant/blob/master/docs/INSTALL_DOCKER.md (Ivan Firefly)

https требовалось для микрофона, без него браузер не разрешает слушать микрофон клиента.

Спасибо за уточнение. Взял докер у Ivan Firefly, но все равно не выходит каменный цветок. Точнее частично выходит. В браузере телефона пишет разборчиво, что я говорю(значит распарсил мой разговор правильно), но Ирина текстом отвечает, что ничего не поняла. Только Доброе утро понимает и здоровается, а на любой другой текст, не понимает. И со звуком еще не разобрался, но хотя бы мой текст в браузере выводит. Еще непонятка, что как я понимаю, все завязано на Винду. В конфиге, пути к медиа вида C:\Program Files\....., а у меня Линукс. Куда мне этот MPCHC приткнуть и нужно ли мне оно вообще? Как -то не нашел вменяемой инструкции от и до для Линукса с докером и с клиентами непонятка. Если через телефон, есть ли Андроид приложение или только в браузере телефона запускать ссылку на сервер, вида https://IP:5003/mic_client или /webapi_client? И для чего у Ivan Firefly в докере порт 5004 тоже задействуется? Как то все фрагментарно об'ясняется, тут, там. Или я несообразительный. Не получается переварить все в цельный и понятный образ. Вот сервер, вот клиент, вот говорю, вот слышу голос Ирины(откуда кстати, из клиента?) а в докере пробрасывается /dev/snd:/dev/snd но ведь у меня сервер без звуковой части. Просто дебиан машинка в домашней сети перед маршрутизатором. Как звук попадает в клиента? Или я все не так понимаю вообще? Допускаю. Я не настоящий сварщик.

В браузере телефона пишет разборчиво, что я говорю(значит распарсил мой разговор правильно), но Ирина текстом отвечает, что ничего не поняла.

Отслеживайте, что команда корректная. "Ирина дата" например

Еще непонятка, что как я понимаю, все завязано на Винду. В конфиге, пути к медиа вида C:\Program Files\....., а у меня Линукс. Куда мне этот MPCHC приткнуть и нужно ли мне оно вообще?

Ничего не завязано, один плагин на MPC-HC (делал под себя), все остальное независимо.

Если через телефон, есть ли Андроид приложение или только в браузере телефона запускать ссылку на сервер, вида https://IP:5003/mic_client или /webapi_client?

Есть, зайдите в Телеграм-группу через ссылку на Гитхабе, там обсуждается.

 И для чего у Ivan Firefly в докере порт 5004 тоже задействуется?

Не знаю, все вопросы по Докеру не ко мне.

Отслеживайте, что команда корректная. "Ирина дата" например

Это да, команду Дата и Время отрабатывает корректно, только время почему-то UTC пишет. Я думал ее надо просить вежливо как женщину, а она вежливо не понимает. Вот если рявкнуть коротко, как фашист в кино, "Ирина, Дата", тогда пишет ответ. Но она ж не собака, "Ирина, к ноге". :( А как просто спросить что нибудь отвлеченное? Плагин болталка в папке плагинов имеется. Или надо еще что-то настроить? А где можно увидеть весь список базовых команд? Не нашел.

UPD:

Ставит таймеры, как то странно. Команду отрабатывает корректно, но судя по логам, время окончания таймера меньше текущего и соответственно таймер не завершается никогда.

Со временем команды "Время", разобрался. Добавил в докер ссылку на мою текущую Timezone и Ирина сообщает правильное время.

    volumes:
      - /etc/localtime:/etc/localtime:ro
      - /etc/timezone:/etc/timezone:ro

А как просто спросить что нибудь отвлеченное?

Ирина справка курс доллара к рублю (справка)

Ирина поболтаем (болталка)

нужен будет ключ VseGPT или другой конннект к ЛЛМ

Ирина справка курс доллара к рублю

Не понимает.

Не знаю, все вопросы по Докеру не ко мне.

А подскажите пожалуйста контакты Ivan Firefly. На его Гитхабе не нашел, а есть к нему вопросы. Заранее спасибо. Только Телеграм не предлагайте, я ярый и принципиальный противник Телеграма, так как он злостный(хоть и невольный) рассадник и проводник жульничества и аферизма(но это уже не по теме)

Не знаю, могу предложить issue Гитхаба.

Не знаю, могу предложить issue Гитхаба.

Пытался. Ivan Firefly запретил issue у себя в Гитхабе. Прям Штирлиц какой-то. Надеюсь, хоть читает тут тему и комментарии.

A может Вы подскажете? Вопрос общего порядка. У Ivan Firefly есть тонкий клиент Remote Irene в виде докера. А как им пользоваться то? Где его интерфейс?

Sign up to leave a comment.

Articles