Эволюционный агент: как ИИ учится улучшать логику обработки заявок для банкоматов Сбера

Привет, Хабр! Меня зовут Роберт Арифулин. Я в Сбере разрабатываю ИИ-решения для банкоматов и других устройств самообслуживания. Сегодня я хочу рассказать, как мы сделали эволюционный агент, который автономно прокачивает промышленного агента по восстановлению работоспособности банкоматов.
Представьте: сложная нетипичная неисправность в банкомате, огромная инструкция с вариантами решения по устранению неисправностей на тысячи строк, и ИИ-агент на GigaChat, которому нужно выбрать правильную процедуру и сформировать решение для системы мониторинга.
Чтобы составить порядок работ по восстановлению банкомата, сотрудник мониторинга банкоматов обычно опирается не только на единую инструкцию (стандарт), но и на множество дополнительных, не всегда формализованных знаний: где в системе мониторинга найти нужную информацию, какие комбинации статусов компонентов банкомата помогут найти неявную проблему и какие внешние изменения могут повлиять на процессы восстановления работы. Эта информация часто разбросана по разным системам и напрямую агенту недоступна.
На первом этапе внедрения агента такие знания приходилось добавлять вручную: эксперты дописывали подсказки к шагам инструкции, чтобы помочь LLM выбрать правильный вариант ответа на вопрос. Это работало, но с ростом количества процедур и сценариев, в которых работает агент, такой подход становился всё более ресурсоёмким. Затраты на написание подсказок росли и снижали эффект от внедрения ИИ-решения. Мы понимали, что из-за перемен в окружении и процессах мы постоянно должны будем тратить на эту работу много сил. И чтобы избежать этого, разработали эволюционный агент для итеративного улучшения агента мониторинга банкоматов.