MCP не умер: почему ИИ-агенты тонут в контексте / Хабр

Год назад Model Context Protocol (MCP) казался решением всех проблем разом. Один протокол, чтобы связать ИИ-агентов с GitHub, Slack, Jira и внутренними базами данных. Никаких кастомных плагинов, только чистая стандартизация. И индустрия в это поверила: к концу 2025 года MCP поддерживали ChatGPT, Cursor, Gemini и VS Code, а количество серверов перевалило за 10 000.

Но в апреле 2026 года мы столкнулись с суровой реальностью: MCP не умер, но подход "подключи все инструменты сразу» с треском провалился. Разработчики обнаружили, что их ИИ-агенты внезапно поглупели. Оказалось, что проблема не в интеграции, а в когнитивной перегрузке. Я разобралась, почему бесконтрольное подключение всего подряд через MCP убивает производительность агентов, и какие 3 архитектурных паттерна пришли ему на смену.

Кризис контекста: когда больше значит хуже

Первая ошибка, которую совершили почти все команды при внедрении MCP, была самой логичной. Если у нас есть стандартный способ дать агенту новые возможности, почему бы не дать ему все возможности?

Разработчики подключали сервер для работы с кодом, сервер для документации, сервер для баг-трекера и сервер для аналитики. В результате, еще до того, как пользователь задавал первый вопрос, в контекстное окно агента загружались десятки схем API, описаний функций и параметров.

В некоторых случаях только инициализация инструментов съедала до 55 000 токенов контекста.

Традиционная программа может держать в памяти огромный каталог API без потери производительности. Но ИИ-агент работает иначе. Он должен анализировать все, что находится в его контекстном окне. Ему нужно выбрать правильный инструмент, решить, как его вызвать, и удержать в памяти важные части результата, не утонув в информационном шуме.

Anthropic в своем руководстве по контекст-инжинирингу прямо заявляет:

"Контекст ограничен и не становится полезнее просто от объема. Поэтому его лучше строить вокруг минимального набора действительно важных данных, которые нужны для решения задачи."

Проще говоря, ИИ-агент не становится умнее, когда видит каждую схему и каждую операцию при запуске. Он становится рассеянным. Большое контекстное окно не отменяет необходимости в гигиене инструментов.

Три решения проблемы перегрузки

Индустрия быстро поняла, что стандартизация доступа к внешним системам - это только половина дела. Вторая половина - это управление тем, когда и как агент видит эти инструменты. Сейчас на передовой agentic engineering доминируют 3 подхода.

1. Динамический поиск инструментов (Tool Search)

Вместо того чтобы загружать все схемы при старте, агент получает только один мета-инструмент: поиск по каталогу возможностей. Когда поступает задача, агент сначала делает запрос к реестру, находит нужные инструменты для конкретного шага, загружает их схемы, выполняет работу и выгружает их из контекста. Это радикально снижает когнитивную нагрузку, хотя и добавляет задержку на дополнительные API-вызовы.

2. Agent Skills (Навыки по требованию)

Этот подход появился в конце 2025 года как ответ на разрастание MCP. Agent Skills - это открытый стандарт Anthropic для упаковки навыков агента (Skills) в отдельные модули. Вместо того чтобы держать в контексте все инструкции и инструменты сразу, агент подгружает нужный навык под конкретную задачу. Это снижает перегрузку контекста и делает работу агента более предсказуемой.

Отдельно про Skills я рассказала в своей статье Практический гид по Claude Skills, проектам и Claude Code: как собрать свой ИИ-стек, возможно, вам будет интересно ознакомиться.

Условно, вместо того чтобы давать агенту сырой доступ к API Jira, ему дают конкретный навык (skill), например, Создать баг-репорт из логов ошибки. Навык содержит только ту логику и те промпты, которые нужны для этой узкой задачи.

Параметр	MCP подход "дать агенту все сразу"	Agent Skills
Загрузка в контекст	Все инструменты сразу	Только нужный навык по требованию
Уровень абстракции	Сырые API-эндпоинты	Бизнес-логика и готовые воркфлоу
Расход токенов	Огромный (схемы всего API)	Минимальный (только описание навыка)
Вероятность ошибки	Высокая (агент может запутаться)	Низкая (жестко заданные рамки)

3. CLI-обертки

Самый прагматичный подход 2026 года. Вместо того чтобы заставлять агента разбираться в сложных JSON-схемах через MCP, разработчики пишут простые CLI-утилиты. Агент просто вызывает команду в терминале (например, create-ticket --severity high --desc "DB crash"). Это стоит копейки в токенах и работает невероятно надежно, хотя и лишает агента возможности самостоятельно исследовать API.

Что в итоге?

MCP жив и чувствует себя прекрасно. Это по-прежнему лучший стандарт для интеграции. Умерла только сама идея, что одной совместимости между системами достаточно, чтобы построить надежного ИИ-агента.

Если вы строите автономные системы в 2026 году, ваш главный вопрос больше не звучит как "Сколько инструментов я могу подключить?". Теперь это звучит так: "Какой абсолютный минимум информации нужен модели прямо сейчас, чтобы не потерять фокус?".

Автоматизация бизнес-процессов с помощью ИИ-агентов требует не просто умных нейросетей, а умной архитектуры. Контекстное окно - это не безлимитный ресурс, это главное узкое место вашей системы. И гигиена контекста - это первый навык, который вам придется освоить, прежде чем строить что-то серьезное.

P.S: Вы можете поддержать меня в моем телеграм канале, там я пишу о том, в чем разбираюсь или пытаюсь разобраться сама, тестирую полезные ИИ-сервисы, инструменты для офиса, бизнеса, маркетинга и видео.