Maslennikovig Dec 8 2025 at 10:44

Изоляция контекста через субагенты: архитектурный паттерн для долгосрочной работы с Claude Code

Medium

15 min

9.4K

TypeScript *

Case

+16

Comments 16

impwx Dec 8 2025 at 12:41

Начинаете работу над проектом. Контекст: ~10K токенов.
Через 3-4 задачи: контекст раздулся до 30K токенов (история изменений, прошлые обсуждения).
Через неделю: 50K+ токенов.

Какие-то фантастические цифры. Даже на небольшом проекте 150к токенов (лимит до autocompact) накапливается буквально за полчаса-час активной работы.

Maslennikovig Dec 9 2025 at 13:31

Все зависит от используемых MCP серверов и методологии. Я использую методологию https://github.com/github/spec-kit. Что касается MCP серверов, хотя я их динамически подключаю в зависимости от необходимости через скрипт. Но все равно они занимают огромное количество токенов. Вот пример одного не самого большого проекта:

Но, как я уже ответил в предыдущем комментарии, очень сильно спасает работа основного агента как оркестратора. Я его очень жестко держу в рамках того, чтобы он не выходил из этой роли.

shaurgon Dec 9 2025 at 08:00

А зачем статью Claude писал? Уж больно характерные паттерны "лучше, чем", "было/стало" и другие. Хоть эмодзи убрали, и то хлеб, но следующие части пишите вживую, пожалуйста.

По контексту - откровенный пи***ж, 200к токенов Claude - час работы максимум, какие недели? Тот же MCP Playwright, несмотря на его ультра-полезность, кушает 20к с порога, о чем /context говорит прямо. При активной разработке контекст выжирается за 10-15 минут, после чего автоочистка срабатывает. Да, сессию можно не разрывать несколько дней, но чем дальше в лес, тем толще партизаны.

Итого, мы имеем, без специализированных хранилищ контекста оркестратор может улучшить работу примерно раза в 2, но не в 10, как у вас написано. Тут можно обсудить, возможно, слона не заметил 🤪

А за репу спасибо, пошел изучать. Кстати, не думали содержимое обернуть в плагин?

Maslennikovig Dec 9 2025 at 13:36

Думал обернуть в плагин, но руки еще не дошли. По поводу часа работы, иногда он и дольше у меня работает. Специально, когда будет такое, сделаю скрины, потому что у меня может использоваться довольно-таки большое количество агентов, каждый из них работает со своим контекстным окном. А контекстное окно основного агента, как оркестратора, я стараюсь беречь. По поводу характерных паттернов я согласен. Я создаю по сути промт того, о чем хочу написать. Клауд помогает мне превратить это уже в полноценный текст. Даже врать здесь не буду, что все сам. У меня времени писать полноценно что-то нет, а иногда хочется что-то обсудить(( Хотя я же обещал не врать?:))) Лениво мне писать статью ручками, но я все вычитываю прежде чем отправить! В комментариях пишу все сам, честно:)

Maslennikovig Dec 9 2025 at 19:38

Вот пример сегодняшний, еще даже не закончил работу, я думаю, еще закончится только минут через 15-20.

JulStar Dec 9 2025 at 14:06

Спасибо, отличная, полезная статья. Может забегаю вперёд, Claude и остальные агенты локальные?

Maslennikovig Dec 9 2025 at 19:37

День добрый, да, все локальное. Спасибо, очень приятно, что понравилась статья:)

sidewinder1 Dec 10 2025 at 05:52

Спасибо за хорошую статью. При начале работы со SpecKit есть ещё одна нулевая фаза - specify.constitution - Вы её пропускаете? Для меня это самый сложный этап, поэтому со speckit у меня не получилось подружиться, в отличие от task-master.

Maslennikovig Dec 10 2025 at 13:49

День добрый. Нет, ни в коем случае не пропускаю. Это ключевая история, где я прописываю все правила работы, все правила игры. Она для меня одна из самых важных.

kemsky Dec 10 2025 at 14:25

Что за проекты такие? Написано об ускорении на 75% при сокращении времени с 3 месяцев до двух недель, что с математикой у вашего агента?

Maslennikovig Dec 10 2025 at 16:35

День добрый, спасибо, что Вы так внимательны. Признаю математическую ошибку, но в первую очередь интересны комментарии по поводу самого репозитория, что можно изменить, улучшить, сделать интересней. Буду рад.

arniksup Dec 10 2025 at 20:51

Спасибо. Подход звучит интересно, надо попробовать. Сам с Клодом начал работать только неделю назад и то пока только в веб-версии. Дайте совет новичку в этом направлении - с чего начать и куда копать?

Репозиторий по ссылке в статье недоступен, 404. А вот так открывается:

https://github.com/maslennikov-ig/claude-code-orchestrator-kit

Maslennikovig Dec 11 2025 at 12:43

День добрый, спасибо, поправил. Рекомендую просто скачать репозиторий и дать Claude задачу, расскажи мне, как это правильно использовать. И он даст советы, можно будет его спрашивать и доп.вопросы.

artemshaer Dec 11 2025 at 05:25

Отличный паттерн имхо. Изоляция через субагентов действительно меняет правила игры в долгих проектах, особенно когда инструменты подгружаются динамически. По своему опыту подтверждаю: контекст главного «дирижёра» стабильно держится в районе 10–15 тысяч токенов, качество ответов не падает даже через десятки часов работы.

Но вот нюанс из обсуждения на Reddit : параллельные субагенты почти не тратят токены основного чата, но довольно быстро «сжигают» лимиты по количеству запросов в минуту (RPM/TPM). У вас на тарифе Max это ощущается или пока не доходило до потолка? Будет здорово, если в статье появится пара строк про эти ограничения — многим читателям это сэкономит неожиданные «затыки» на проде.

Maslennikovig Dec 11 2025 at 12:45

Есть такой нюанс, спору нет, но 4,5 Opus в целом довольно экономичная модель. Ну и да, я использую подписку за 200 долларов, мне ее всегда хватает, хотя я огромное количество работы делаю через Claude. Уверен, что если бы работал только с одним проектом, хватало бы 100 долларовой подписки. Но не стоит забывать и про обратную медаль. Мы экономим на постоянном компакте, постоянном перезапуске основного агента. Конечно, она не окупает затраты использования субагентов, но тут каждый решает сам для себя. Субагенты очень сильно экономят время разработки, повышают ее качество.

artemshaer Dec 11 2025 at 13:59

Согласен, контекст в Claude реально 'съедается' за 10–15 мин активной работы - без изоляции сессии не держатся дольше часа. Ваш оркестратор с субагентами круто решает это, особенно с SpecKit для фаз (read-plan-execute).

Но сравнивая с веб-версией: там разбивка по проектам (общая дока разово, чат на задачу) проще, но последовательная - нет параллелизма субагентов. В Open WebUI обзор чатов помогает управлять сессиями (поиск/суммаризация), но без динамической изоляции, как у вас.

А если комбинировать: субагенты внутри веб-чатов по проектам? Или плагин для Open WebUI с MCP? Пробовали такое?