
Год назад Model Context Protocol (MCP) казался решением всех проблем разом. Один протокол, чтобы связать ИИ-агентов с GitHub, Slack, Jira и внутренними базами данных. Никаких кастомных плагинов, только чистая стандартизация. И индустрия в это поверила: к концу 2025 года MCP поддерживали ChatGPT, Cursor, Gemini и VS Code, а количество серверов перевалило за 10 000.
Но в апреле 2026 года мы столкнулись с суровой реальностью: MCP не умер, но подход "подключи все инструменты сразу» с треском провалился. Разработчики обнаружили, что их ИИ-агенты внезапно поглупели. Оказалось, что проблема не в интеграции, а в когнитивной перегрузке. Я разобралась, почему бесконтрольное подключение всего подряд через MCP убивает производительность агентов, и какие 3 архитектурных паттерна пришли ему на смену.
Кризис контекста: когда больше значит хуже
Первая ошибка, которую совершили почти все команды при внедрении MCP, была самой логичной. Если у нас есть стандартный способ дать агенту новые возможности, почему бы не дать ему все возможности?
Разработчики подключали сервер для работы с кодом, сервер для документации, сервер для баг-трекера и сервер для аналитики. В результате, еще до того, как пользователь задавал первый вопрос, в контекстное окно агента загружались десятки схем API, описаний функций и параметров.
В некоторых случаях только инициализация инструментов съедала до 55 000 токенов контекста.
Традиционная программа может держать в памяти огромный каталог API без потери производительности. Но ИИ-агент работает иначе. Он должен анализировать все, что находится в его контекстном окне. Ему нужно выбрать правильный инструмент, решить, как его вызвать, и удержать в памяти важные части результата, не утонув в информационном шуме.
Anthropic в своем руководстве по контекст-инжинирингу прямо заявляет:
"Контекст ограничен и не становится полезнее просто от объема. Поэтому его лучше строить вокруг минимального набора действительно важных данных, которые нужны для решения задачи."
Проще говоря, ИИ-агент не становится умнее, когда видит каждую схему и каждую операцию при запуске. Он становится рассеянным. Большое контекстное окно не отменяет необходимости в гигиене инструментов.
Три решения проблемы перегрузки
Индустрия быстро поняла, что стандартизация доступа к внешним системам - это только половина дела. Вторая половина - это управление тем, когда и как агент видит эти инструменты. Сейчас на передовой agentic engineering доминируют 3 подхода.
1. Динамический поиск инструментов (Tool Search)
Вместо того чтобы загружать все схемы при старте, агент получает только один мета-инструмент: поиск по каталогу возможностей. Когда поступает задача, агент сначала делает запрос к реестру, находит нужные инструменты для конкретного шага, загружает их схемы, выполняет работу и выгружает их из контекста. Это радикально снижает когнитивную нагрузку, хотя и добавляет задержку на дополнительные API-вызовы.
2. Agent Skills (Навыки по требованию)
Этот подход появился в конце 2025 года как ответ на разрастание MCP. Agent Skills - это открытый стандарт Anthropic для упаковки навыков агента (Skills) в отдельные модули. Вместо того чтобы держать в контексте все инструкции и инструменты сразу, агент подгружает нужный навык под конкретную задачу. Это снижает перегрузку контекста и делает работу агента более предсказуемой.
Отдельно про Skills я рассказала в своей статье Практический гид по Claude Skills, проектам и Claude Code: как собрать свой ИИ-стек, возможно, вам будет интересно ознакомиться.
Условно, вместо того чтобы давать агенту сырой доступ к API Jira, ему дают конкретный навык (skill), например, Создать баг-репорт из логов ошибки. Навык содержит только ту логику и те промпты, которые нужны для этой узкой задачи.
Параметр | MCP подход "дать агенту все сразу" | Agent Skills |
Загрузка в контекст | Все инструменты сразу | Только нужный навык по требованию |
Уровень абстракции | Сырые API-эндпоинты | Бизнес-логика и готовые воркфлоу |
Расход токенов | Огромный (схемы всего API) | Минимальный (только описание навыка) |
Вероятность ошибки | Высокая (агент может запутаться) | Низкая (жестко заданные рамки) |
3. CLI-обертки
Самый прагматичный подход 2026 года. Вместо того чтобы заставлять агента разбираться в сложных JSON-схемах через MCP, разработчики пишут простые CLI-утилиты. Агент просто вызывает команду в терминале (например, create-ticket --severity high --desc "DB crash"). Это стоит копейки в токенах и работает невероятно надежно, хотя и лишает агента возможности самостоятельно исследовать API.
Что в итоге?
MCP жив и чувствует себя прекрасно. Это по-прежнему лучший стандарт для интеграции. Умерла только сама идея, что одной совместимости между системами достаточно, чтобы построить надежного ИИ-агента.
Если вы строите автономные системы в 2026 году, ваш главный вопрос больше не звучит как "Сколько инструментов я могу подключить?". Теперь это звучит так: "Какой абсолютный минимум информации нужен модели прямо сейчас, чтобы не потерять фокус?".
Автоматизация бизнес-процессов с помощью ИИ-агентов требует не просто умных нейросетей, а умной архитектуры. Контекстное окно - это не безлимитный ресурс, это главное узкое место вашей системы. И гигиена контекста - это первый навык, который вам придется освоить, прежде чем строить что-то серьезное.
P.S: Вы можете поддержать меня в моем телеграм канале, там я пишу о том, в чем разбираюсь или пытаюсь разобраться сама, тестирую полезные ИИ-сервисы, инструменты для офиса, бизнеса, маркетинга и видео.
