Обновить

Готовим ИИ-агента к продакшену

Уровень сложностиПростой
Время на прочтение18 мин
Охват и читатели8.2K
Всего голосов 16: ↑15 и ↓1+14
Комментарии2

Комментарии 2

Спасибо за статью, достаточно подробно! Рассматривали ли подключение кэша по агентским запросам с семантическим поиском по истории запросов для экономии токенов LLM?

Спасибо за вопрос! Пока нет, имеет смысл, когда наберётся достаточно реальной истории, будет понятно, есть ли смысл оптимизировать и что именно. Стартово не рассматривал ещё и потому, что для агента-консультанта важно отвечать не шаблонно, а подстраиваться под ситуацию и стиль конкретного пользователя.

Плюс в нашем случае все вопросы контекстно-зависимы и в базе знаний информация может меняться частенько. И еще есть нюанс, связанный с тем, что в таком кэше надо быть уверенным, что туда не закрались ошибочные ответы ) Поэтому кажется проще подготовить выверенный FAQ, сделать его частью базы знаний, обновлять синхронно с основными документами и уже его использовать как альтернативу кэшу по истории диалога.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
llmstart.ru
Дата регистрации
Дата основания
Численность
2–10 человек
Местоположение
Россия
Представитель
Сергей Смирнов