WrongName26 окт 2024 в 17:11

DE-1. DIY ассистент на LLM

Средний

9 мин

24K

HabrJavaScript * Python * ЗвукИскусственный интеллект

Из песочницы

+23

Комментарии 7

janvarev 27 окт 2024 в 02:57

Поскольку уже 2.5 года пилю своего опенсорс голосового помощника Ирину, оставлю ссылку на свою хабрастатью: Ирина, голосовой помощник — теперь и со вкусом GPT-3

Собственно, там уже есть:

плагины для выполнения разных команд
streaming-распознавание входящей речи (VOSK STT, еще до появления Whisper, и он хорош)
куча TTS-ных плагинов - если нужно, XTTS тоже народ делал. Но можно и что-то более простое, что без проблем пойдет на Raspberry Pi (XTTS там ввиду тяжеловесности не взлетит)
Если нужно конкретно диалог с GPT-сетями, то есть плагин, который подключается к любому OpenAI-like endpoint.

WrongName 28 окт 2024 в 10:54

Выглядит очень мощно. Спасибо, обязательно попробую)

Devastor87 27 окт 2024 в 11:41

Ой, наконец-то, полноценная чёткая статья как реализовать мою мечту, а самому лень 😁

Даже не дочитывая, сразу лайк, ибо обязательно пригодится, есть идея с чем это можно соединить, сделаю, я вам первому покажу (если интересно😏), скажем так, это ещё больше "оживит" систему в сегодняшних технологических возможностях 😜

WrongName 28 окт 2024 в 10:54

Благодарю. Конечно интересно, если что выгорит, пишите)

0x131315 27 окт 2024 в 15:18

https://habr.com/ru/articles/852900/ и https://habr.com/ru/companies/mts_ai/articles/831220/ - еще пара кирпичиков в фундамент нормального ассистента, возможность не только формировать ответы, но и взаимодействовать с окружением

WrongName 28 окт 2024 в 10:54

То что нужно, как раз недавно смотрел как Claude научили взаимодействовать с пк, тоже загорелся. Спасибо)

Fesc 28 окт 2024 в 20:43

Классная статья, только только разобрался с whisper, а тут уже ковровая дорожка к следующей цели)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий