Что, если я скажу вам, что можно за 72 часа(личный вызов/ограничение) в одиночку спроектировать, собрать и отладить RAG-систему, архитектура которой основана на пяти state-of-the-art научных статьях, опубликованных буквально в последние месяцы? В рамках хакатона AI for Finance Hack 2025 от Changellenge » я решил проверить это на практике. Спойлер: было больно, интересно, а результат превзошел все ожидания.
Задача хакатона была классической, но с подвохом: создать финансового AI-ассистента, который дает точные ответы на вопросы пользователей, основываясь на предоставленной базе знаний. "С подвохом" — потому что среди простых вопросов вроде "что такое ОСАГО" скрывались и сложные, многоэтапные ("multi-hop") кейсы: "сравни условия по продукту А и продукту Б", "какой был лимит по вычету в прошлом году и как он изменился сейчас?".
Стандартный RAG-подход "найди похожие документы -> передай в LLM" на таких задачах быстро ломается. Он либо не находит все части информации, разбросанные по разным документам, либо находит слишком много "шума", в котором "тонет" языковая модель.
Поэтому, вместо того чтобы строить очередной простой RAG, мы решили пойти по пути "тяжелой артиллерии" — спроектировать полноценного агентского помощника, который умеет планировать, анализировать и итеративно уточнять поиск.
Эта статья — история нашего штурма: от амбициозного плана, собранного из передовых исследований, через жестокую реальность отладки API и библиотек, до финальной, оптимизированной и высокопроизводительной архитектуры. Я покажу, какие именно идеи из научных статей мы взяли, как адаптировали их под жесткие рамки хакатона и, самое главное, как решали проблемы, которые возникали на каждом шагу.