Code with Claude 2026: что Anthropic показали разработчикам на своей конференции / Хабр

6 мая 2026 года в Сан-Франциско прошла вторая конференция Anthropic для разработчиков — Code with Claude. Площадку для мероприятия в этот раз расширили: в этот раз взяли бывший автосалон SVN West, так как спрос оказался выше.

Следующие 2 конференции пройдут в Лондоне и Токио (19 мая и 10 июня), а записи всех докладов должны опубликовать в ближайшее время на YouTube канале Claude Code.

Для тех, кто хочет посмотреть все доклады уже сейчас, опубликовал полную запись в ТГК (5+ часов видео).

Ниже пройдемся по всем докладам и отметим самое важное.

Открытие: удвоение rate limits и партнёрство со SpaceX

CPO Anthropic Эми Вора открыла конференцию с двух цифр. Первая — API volume на платформе вырос в 17 раз год к году. Вторая — средний разработчик на Claude Code проводит с ним 20 часов в неделю.

На этом фоне Anthropic объявили об удвоении 5-часовых rate limits для Pro, Max, Team и Enterprise-планов Claude Code, а также о заметном увеличении лимитов по API. Сделать это позволило партнёрство со SpaceX: Anthropic получил доступ к полной мощности дата-центра Colossus 1.

Дарио Амодеи в своей части пояснил, откуда вообще такие проблемы с compute. В первом квартале 2026 выручка Anthropic, если экстраполировать, росла темпом 80x в год. Планировали на 10x. Разрыв в 8 раз, именно по этой причине периодически ограничивали доступ.

Развитие моделей: Opus 4.7 и что дальше

Диана (research PM, участвовала в выпуске 18 версий Claude) сделала доклад о модельном слое.

Из конкретного: Opus 4.7 уже используют несколько компаний. AMP перевёл на него весь smart mode и упростил scaffolding — модель перестала нуждаться в подпорках. Rakuten отчитался о трёхкратном росте числа решённых production-задач. Intuit заметил, что модель сама находит логические ошибки на стадии планирования и бэктрекает до начала исполнения.

На следующий день после Opus 4.7 Anthropic Labs выпустила Claude Design — инструмент для генерации интерфейсов. Несколько команд уже используют его вместе с Claude Code для production-разработки.

Из обозначенных направлений на ближайшее время: «суждение и вкус в коде» для сложных автономных задач, контекстные окна, которые будут ощущаться "бесконечными" в сочетании с памятью, и multi-agent координация. Диана вводила понятие task horizon — сколько Claude может работать автономно, не теряя качества. Год назад минуты, сейчас часы. Следующий шаг — агенты, которые знают, что делать, без явного запуска.

Главный тезис для разработчиков: проектировать под следующую версию модели, не под текущую. Кто оптимизирует архитектуру под следующий скачок интеллекта — тот получает преимущество.

Claude Platform: Managed Agents, Outcomes и Dreaming

Анджела и Кейтлин показали обновления платформы.

Начали с advisor strategy — архитектурного паттерна, который позволяет запускать дешёвую модель (Haiku/Sonnet) в роли executor'а, а дорогую (Opus) в роли advisor'а. Sonnet вызывает Opus только когда упирается. Eve Legal, один из партнёров, сообщил о качестве frontier-модели при пятикратно меньших затратах.

Основной анонс — три новых фичи Claude Managed Agents.

Multi-agent orchestration. Coordinator-агент запускает специализированных sub-агентов с независимыми контекстными окнами и общей файловой системой. Изолированные контексты дают лучшее качество, чем один большой промпт.
Outcomes. Разработчик описывает в markdown-файле критерии успеха (rubric). Claude итерируется через несколько сессий, пока не выполнит условия. Отдельный grader-агент оценивает каждый прогон против рубрики. Можно указать максимальное количество итераций.
Dreaming. Claude рефлексирует над прошлыми сессиями, сам решает, какие знания стоит сохранить в память, и пишет «playbooks» для будущих запусков. Нажимаешь кнопку Dream в консоли — агент берёт логи прошлых сессий и самостоятельно обновляет базу знаний. В демо с симуляцией посадки дронов на Луну результат после Dreaming улучшился на провальных сценариях без регрессии на хороших.

Демо строилось вокруг гипотетического стартапа Lumara — агентная система для автономной посадки дронов ради добычи ресурсов. 4 из 6 тестовых сайтов закрыты с первого запуска

После Dreaming — все 6.

Notion, один из реальных партнёров, уже встроил Managed Agents в продукт для долгосрочных автономных задач.

Claude Code: Routines, Auto Mode, Work Trees

Кэт и Борис Черни (head of Claude Code) провели доклад по продукту.

Ключевая метрика: внедрение Claude Code wall-to-wall в Anthropic дало рост числа PR на 200% на инженера при том же качестве кода.

Примеры с рынка. Shopify использует Claude Code не только в инженерных командах, но и в дизайне, продукте, data science. MercadoLibre — 23 000 инженеров, 500 000+ проверенных PR, 9 000+ модернизированных приложений. Цель — 90% автономного кодирования и полностью агентный PR-цикл к Q3 2026.

Новые фичи:

Routines — промпты с триггерами. Настраиваешь один раз: cron, webhook, GitHub-событие или произвольный API-вызов. Claude запускается без тебя. В demo: GitHub issue появился ночью → routine подхватил → утром готов PR. Работают как локально, так и на удалённых серверах Anthropic.
CI Autofix — следит за PR: автоматически правит замечания из code review, фиксит упавший CI, делает rebase при конфликтах. Если CI упал из-за network timeout — routine диагностирует, что это инфраструктурная флака, делает retry.
Auto Mode — режим разрешений, где Claude сам принимает решение о tool call через классификатор. Проверяет два вещи: деструктивность действия и признаки prompt injection. Если ок — выполняет. Если нет — блокирует и продолжает сессию.
Work Trees — каждый агент работает в изолированном git work tree. Несколько фич параллельно, без конфликтов. Можно запросить явно через claude --work-tree, а можно написать в промпте — Claude сам решит.
Auto Memory — Claude управляет директорией memory.md на уровне проекта. Сам решает, что стоит запомнить для будущих сессий. Работает для sub-агентов тоже.
No Flicker Mode — полный рефактор рендерера CLI: виртуализированный scrollback, константное потребление памяти и CPU, кликабельные элементы в терминале. Включается через CLAUDE_NO_FLICKER=1.
Remote Control — запускаешь сессию на рабочей машине, подключаешься с телефона через браузер или приложение. Тот же контекст, тот же dev-окружение.
Desktop — отдельная поверхность с полноэкранным GUI, split view, sidebar для управления сессиями, diff view с комментариями, встроенный browser preview. Есть экспериментальная фича «chapters» — можно закрепить часть транскрипта как главу с названием, из них автоматически собирается table of contents.
Code Review (/ultra-review) — многофазная проверка через несколько независимых агентов: один смотрит на одно, другой на другое, потом верификация нашёл ли каждый реальную проблему.

GitHub Copilot: prompt caching и rubber duck

Марио Родригес (CPO GitHub) рассказал, как Copilot работает с Claude API в масштабе с «миллиардами запросов». Сам он назвал их «дорогостоящими уроками».

Главное — prompt caching. Для GitHub 1% эффективности = миллионы долларов, по аналогии с high-frequency trading.

Три правила:

Никакого dynamic content в системном промпте: UUID или timestamp в system — обнуляет весь кэш.
Tools менять только с регрессионными тестами: любое изменение в tools-prefixе сбрасывает кэш всего диалога.
Cache affinity в multimodal harness: когда пользователь переключается между Opus, GPT и OSS-моделями, следующий вызов Opus должен попасть на тот же сервер.

Об advisor strategy: Марио подтвердил со своей стороны то, что Anthropic показала ранее. Совместно разработали «rubber duck» — вариацию critic-модели. Вместо постоянного advice — Opus вставляется точечно в три момента: после drafting плана, после сложной имплементации, после написания тестов (до запуска). По словам Марио, самое полезное место — план: если поймать ошибку там, дальше всё чище.

Отдельно — совет про контекстные окна. Большой контекст не дороже маленького, если правильно управлять compaction. Чем чаще compaction — тем больше output tokens, тем дороже. Тест GitHub: при одинаковой модели с малым контекстом compaction случался втрое чаще, суммарные затраты — выше.

Managed Agents: deep dive (Джесс Ян и Лэнс Маркман)

Отдельная сессия от команды Claude Managed Agents. Лэнс показал агента-аналитика Pascal на гипотетическом датасете продуктового магазина: агент сам запускает Python-пакеты в изолированном контейнере, строит визуализации и находит инсайты за минуты.

Интересный паттерн из доклада — inner loop + outer loop. Inner loop: outcomes с rubric-агентом, итерируется автономно. Outer loop: ты смотришь на результат, говоришь Claude Code что не нравится, Claude Code правит rubric или инструкции агента и запускает новую сессию. Два инструмента работают вместе.

Реальный результат на оптимизации скорости рендеринга: агент сам обнаружил, что параллельные tool calls работают быстрее, нашёл fast mode, оптимизировал промпты — время с 37 секунд сократилось до 10. Без ручного вмешательства.

Финальная беседа: Дарио и Даниэла Амодеи

Дарио о предсказании 2025 года: год назад он сказал, что в 2026 появится первая компания стоимостью миллиард долларов с одним сотрудником.

Пока не случилось, но есть двухзвеньевые компании с такой оценкой и одиночки с несколькими сотнями миллионов. Восемь месяцев ещё есть.

О следующем шаге: переход от одиночных агентов к командам агентов, потом к целым организациям.

Мы идём от умной команды в одной комнате к стране гениев в датацентре.

Про "бутылочное горлышко": по закону Амдала — если ускорить написание кода, следующим узким местом становится верификация, потом планирование. Дарио добавил, что code — хорошая область, потому что верифицируемая через тесты. Следующий вызов — области, где верификация субъективна: security, design quality. Решение этого откроет прогресс в других доменах, не только в разработке.

Даниэла о миссии: у Anthropic внутри есть культурный принцип «hold light and shade» — держать свет и тень вместе. Модели становятся мощнее, возможностей больше, рисков тоже. Задача — не выбирать одно, а балансировать.

Финальная сессия: Борис Черни и Джаред Самнер (Bun)

Живое демо. Джаред Самнер показал, как проект Bun использует Claude Code в production.

У Bun есть RoboBun — бот, который автоматически пытается воспроизвести каждый поданный GitHub issue и открыть PR с фиксом и тестом. Требование перед открытием PR жёсткое: тест должен падать на прошлой версии и проходить на патче. За последние 3 месяца RoboBun стал бо́льшим контрибьютором в репо, чем сам Джаред.

Что показали: параллельно запущено несколько агентов на разных issues, все работают в auto mode. За ~25 минут эфира было открыто 4 PR. CodeRabbit и Claude Code Review работают в паре: первый — стилистика и CLAUDE.md, второй — глубокие баги, требующие понимания всего контекста. Они комментируют, отвечают и помечают resolved.

Про эволюцию процесса. Раньше bottleneck был в написании кода — ушёл. Потом в верификации и тестах — почти ушёл. Следующий — качество планирования: стоит ли это делать, правильный ли это фикс. PR от Claude — это предложение, а не затраченный труд коллеги, поэтому bar для мержа объективно выше.

Русскоязычное сообщество про AI в разработке

Друзья! Перевод этой статьи подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!