Comments 14
Ну наконец то шото вменяемое.
Спасибо. Рад, что положительно оценили. Во второй части статьи тема будет раскрыта уже более полноценно и законченно.
Жгите.
А то открываешь хабр, видишь на первой странице штук 5 статей про АИ, сгенеренных АИ же, про то как нам будет хорошо плохо очень плохо жить когда АИ поработит весь мир и всех оставит без работы. А тут
а) конкретный кейс а не про "все останутся без работы"
б) оказывается(для многих внезапно), даже этот кейс разрулить - нетривиально и требует соотвествующих скилов.
В последние года два часто вижу одну и туже картинку ракеты. Фанаты/авторы нейрослопа видимо фанаты роя. Авторский стиль, индивидуальность уже не в моде.
Плюсик статье и в карму
а ведь кроме указанных в схеме доступа LLM к RAG через TOOL можно добавлять сразу результаты RAG к промту или блоку документов.
Да, но мы же разбираем агентский подход, в котором агент принимает решение, какой инструмент вызвать, нужен ему раг или нет. Поэтому раг завернут в tool.
архитектурный простор большой.
использовать раг для встраивания релевантных инструкций.
агент может получать дополнительные данные через tool в котором скрыт раг.
те же tool, при их большом числе можно подключать/добавлять к агенту динамично, то есть только небольшой набор tool релевантный(векторно) для конкретного запроса.
Именно, предела нет. В целом все зависит от кейса и архитектора ) Кто как видит способ решения )
Я сторонник того, чтобы динамически менялся контекст/данные, а инструкции и конфигурация агента оставались фиксированными. Это делает систему более понятной, стабильной и тестируемой.
Если количество тулов становится избыточным для одного агента, их количество ведет к снижению качества, запутыванию агента, то я, пожалуй, бы предпочел декомпозировать систему на сабагентов. Выбрал бы понятный паттерн с агентом маршрутизатором (роутером) на входе. Каждый сабагент обладал бы только необходимым ему набором тулов.
Спасибо за информативную статью.
в статье показаны разные системные промты(правила ответов, инструменты, правила безопасности, примеры работы.)
это отдельные системные промты? или это инструкции которые выходят в один системный промт?
Production-ready архитектура AI-агента. Часть 1: ReAct, Advanced RAG, Tools, Prompts