Привет, Хабр! На связи снова Максим Михайлов и моя серия статей про внедрение AI в клиентскую поддержку Cloud.ru.

В прошлой статье я рассказывал, как мы начали осваивать AI в бою — генеративные подсказки, которые помогают инженерам поддержки готовить ответы, и инструмент, который делает эти ответы дружелюбнее. Но это был только разогрев. Сегодня покажу нашу систему AI-агентов, которые дружно работают внутри технической поддержки Cloud.ru и самостоятельно обрабатывают больше 20% обращений.

После того как мы внедрили генеративные подсказки в рабочее место инженера, мы перешли к работе над первым AI-агентом. Сейчас в нашей поддержке уже несколько агентов, собранных в систему, которая работает внутри личного кабинета клиента. Дальше расскажу (и покажу), как это выглядит на практике.

Препроцессинг

Обработка обращений начинается еще в препроцессинге, когда нужно вытащить из разных внутренних систем метаинформацию, которая поможет мультиагентной системе правильно классифицировать, определить намерения и обработать обращение нашего клиента. Например, это могут быть подключенные услуги, проверка на недавние обращения, интерпретация тематики обращения и так далее.

Следующий шаг — мы дорабатываем запрос пользователя, пытаемся его переписать и добавить синонимов. Это поможет найти в будущем максимально релевантные документы и инструкции.

Мультиагентная система

Схематично наша мультиагентная система выглядит именно так:

Все новые агенты встают в столбик, подключаются к MCP, загружают необходимые ресурсы, промпты и тулы и знакомятся с соседями. В ходе взаимодействия с клиентом, на основе имеющейся информации и обратной связи, они могут выполнять функции, уточнять, переспрашивать, выдавать решения или переключить диалог на инженера. При этом для пользователя вся эта схема — просто непрерывный диалог без разрыва связи. Итак, какие агенты у нас внутри.

Агент Router

Каждое обогащенное метой обращение встречает наш Агент Router. В его распоряжении есть 11 анализаторов, каждый из которых оценивает обращение пользователя, а результаты анализа сообщают «судье», который принимает решение: а что мы будем дальше делать с этим обращением.

Из вариантов:

  1. Предобработать, заполнить нужные поля и продуктовую классификацию и отправить в виде задачи на инженера в нужную команду поддержки.

  2. Передать задание одному из агентов внутри мультиагентной системы.

  3. Выглядит это примерно так:

Агент Advisor

Advisor — самый умный из команды агентов. Он ходит в RAG, в котором лежат десятки тысяч статей и документов. Это технология, сочетающая поиск релевантной информации в существующих хранилищах данных и генерацию текста с помощью языковых моделей для создания точных и информативных ответов. На этом этапе отрабатывает сначала ретривер (алгоритм, который быстро отбирает из большой базы знаний наиболее релевантную к запросу информацию) и реранкер (алгоритм, который ранжирует документы, полученные от ретривера). Дальше все данные агрегируются и происходит генерация ответа.

Что такое RAG

Это технология, сочетающая поиск релевантной информации в существующих хранилищах данных и генерацию текста с помощью языковых моделей для создания точных и информативных ответов. Подробнее про технологию рассказывали мои коллеги в этой статье.

Агент Диагностики

Это правая рука агента Advisor. Он перехватывает обращения пользователей, в которых недостаточно информации для принятия решения и берет на себя задачу выяснить все детали. Для этого он запрашивает информацию, просит выполнить команды в терминале, анализирует ответы и только когда собраны необходимые для решения детали — передает на обработку адвайзеру.

В реальной жизни его общение с пользователем выглядит так:

Когда мы создавали агента и смотрели путь пользователя, мы определили, что клиенты чаще всего отправляют скриншоты, чтобы объяснить проблему. Чтобы научиться их «читать», мы добавили модель OCR (оптическое распознавание символов) и дали агентам возможность ее использовать, если необходимо. Это существенно улучшило качество наших ответов.

Агент Ресурсов

Еще один важный член мультиагентной команды, который отвечает за выдачу ресурсов клиентам. Например, если клиенту понадобился дополнительный IP-адрес, агент проверит, сколько их сейчас, сколько он уполномочен выделить и выдаст нужный ресурс, а если полномочий не хватает — передаст задачу инженеру.

Это простой и очень эффективный сценарий, поэтому именно этот агент получает большее количество пятерок от пользователей.

Что дальше

А дальше мы с командой разрабатываем новых агентов, анализируя сценарии пользователей, готовим данные, занимаемся интеграциями с нужными для реализации этих сценариев системами. До конца года мы хотим добавить в дружную мультиагентную семью еще двух агентов, один из которых Агент Баланса.

Если вы тоже хотите запустить свою мультиагентную систему, я рекомендую использовать такой же подход — итерационно разбирать сценарии пользователей и поэтапно развивать мультиагентную систему. Так каждый агент будет эффективно работать на ваших клиентов и покрывать большинство запросов.

А создать систему AI-агентов для ваших задач вы можете с нашим сервисом Evolution AI Agents. Там есть как готовые агенты, так и возможность создать кастомного. Сервис пока в стадии открытого тестирования, так что вы можете бесплатно изучить его возможности.