Комментарии 7
Поскольку уже 2.5 года пилю своего опенсорс голосового помощника Ирину, оставлю ссылку на свою хабрастатью: Ирина, голосовой помощник — теперь и со вкусом GPT-3
Собственно, там уже есть:
плагины для выполнения разных команд
streaming-распознавание входящей речи (VOSK STT, еще до появления Whisper, и он хорош)
куча TTS-ных плагинов - если нужно, XTTS тоже народ делал. Но можно и что-то более простое, что без проблем пойдет на Raspberry Pi (XTTS там ввиду тяжеловесности не взлетит)
Если нужно конкретно диалог с GPT-сетями, то есть плагин, который подключается к любому OpenAI-like endpoint.
Ой, наконец-то, полноценная чёткая статья как реализовать мою мечту, а самому лень 😁
Даже не дочитывая, сразу лайк, ибо обязательно пригодится, есть идея с чем это можно соединить, сделаю, я вам первому покажу (если интересно😏), скажем так, это ещё больше "оживит" систему в сегодняшних технологических возможностях 😜
https://habr.com/ru/articles/852900/ и https://habr.com/ru/companies/mts_ai/articles/831220/ - еще пара кирпичиков в фундамент нормального ассистента, возможность не только формировать ответы, но и взаимодействовать с окружением
Классная статья, только только разобрался с whisper, а тут уже ковровая дорожка к следующей цели)
DE-1. DIY ассистент на LLM