zakarov28 мая в 12:46

Базовый командный runtime для терминальных AI-агентов

Средний

13 мин

7.5K

DevOps * IT-инфраструктура * Серверное администрирование * Искусственный интеллектУправление разработкой *

Туториал

Из песочницы

Комментарии 4

DoubleS 28 мая в 13:32

Актуальная тема. У нас пока на околонулевом уровне, раздали всем желающим Cursor и Claude Code, накидали дерево метрик v1, смотрим, как приживется. Надеюсь, следующая ступенька близка, тоже займемся основательно.

Вообще интересно узнать до какого "уровня зрелости" дошли отдельные компании, и где находится рынок в целом.

zakarov 28 мая в 17:11

В плане командной работы с агентами для разработки рынок на самой зачаточной стадии.

Пока адопшн вращается вокруг персонального использования.
Компании раздают подписки, но не слишком управляют тем, как они используются. Есть аудит (логи) в корп.подписках = уже хорошо.

Самодельные уровни 2-3 пока существует как "частные" инициативы в крупных компаниях, публично это не анонсируют. Иначе сразу начнутся вопросы по работе с "чувствительными данными", на которые никто лишний раз не хочет отвечать.

В основном, уровни 2-3 - вендорские. Github Coding Agent, Anthropic managed/OpenAI cloud и т.д. Публичных кейсов на весь мир пара десятков, early stage adoption.

Экспериментов с открытыми моделями полно, но если быть честными - реальный код enterprise уровня на них редко пишут. Пока не видел, чтобы кто-то сделал полноценные командные процессы разработки с ними. Наверняка уже есть у китайцев, но я их рынок не ресерчил.

В России же ситуация, я думаю, понятная. Легально работать с передовыми агентами не получится. До решения проблем командного runtime массово никто не дошел, насколько я знаю. Запуск агентов в докерах = да, но это не про командную работу, а про изоляцию.

У меня пока есть 2 кейса с большими российскими корпами, где я внедрял уровни 1-2, но оба = "частные" инициативы в рамках 1 направления, пускай и спущенные сверху. Они даже внутри компании особо не афишируют, на чем и как они работают.

Самые успешные кейсы - небольшие гибкие международные команды, в которых технические лидеры уже давно используют агенты на уровне 0 и сами дошли до узких мест с персональным использованием. С ними и получаются "волшебные" иксы в time-2-market, пока в классических командах до сих пор не уверены, можно ли улучшиться хотя бы на 10%.

DDTrue 28 мая в 19:47

Интересный подход с разделением human/agent users. А как решаете проблему с доступом к внешним сервисам из сессии агента?

zakarov 28 мая в 20:41

Предполагаю, что под проблемой имеется в виду присутствие доступа, а не отсутствие.

Короткий ответ для ОС-изоляции - firewall/nftables/iptables по UID.
Доменные вайтлисты можно делать на уровне egress-proxy, а там уже правила и лимиты. Так проще с плавающими IP у CDN'ов. Для установок на РФ-сервера, egress-proxy еще решает вопрос правильного исходящего IP.
Для npm, pypi итп можно использовать зеркала/кеши, чтобы не нужен был весь интернет для зависимостей.
Могут быть переключаемые "строгий" и "мягкий" режимы. Мягкий = когда нужно дать агенту возможность гуглить, фетчить, ресерчить самостоятельно. У меня есть кастомный cli-тул, который выполняет ресерч (и подобные задачи) в headless-claude в отдельном контейнере и возвращает результаты в голых md, соответственно для этого мне "мягкий" режим не нужен. Но это уже усложнение, тогда можно задуматься и о запуске обычных сессий в контейнерах.
В строгом режиме, агенту разрешены DNS, egress-proxy, относительно доверенные url (напр. опенаи/антропик репо) и нужные внутренние эндпоинты. Всё остальное - deny по умолчанию.
Лимитированные/чувствительные API через прокладки, в которых логи, управление ключами/токенами, лимиты/квоты.

Но, если вы уже на уровне, где нужно строго резать сеть, возможно лучше сразу делать на rootless-контейнерах. Особенно если проектов несколько и для каждого свои правила.

ОС-изоляция скорее вариант для быстрого начала работы, либо когда рисками можно пренебречь.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий