Разработчики Cursor опубликовали результаты эксперимента по масштабированию автономных кодинг-агентов. Компания запускала сотни агентов параллельно на одном проекте — они работали неделями и написали более миллиона строк кода. Цель — понять, можно ли решать задачи, которые у команд разработчиков занимают месяцы.

Главной проблемой оказалась координация. Когда агентам дали равный статус и позволили самим делить задачи, двадцать агентов выдавали производительность двух-трех — остальные ждали освобождения блокировок. Хуже того, без иерархии агенты избегали сложных задач и делали мелкие безопасные правки. Решением стало разделение ролей: планировщики исследуют код и создают задачи, воркеры их выполняют и пушат изменения.

Для проверки системы агентам на GPT-5.2 поручили написать браузер с нуля. За неделю непрерывной работы они сгенерировали более трех миллионов строк кода. Движок рендеринга написан на Rust и включает парсинг HTML, каскад CSS, layout, отрисовку текста и кастомную виртуальную машину JavaScript. По словам CEO Cursor Майкла Труэлла, простые сайты браузер рендерит быстро и в основном корректно — хотя до паритета с WebKit или Chromium ещё далеко. 

При этом GPT-5.2 оказалась значительно лучше других моделей для долгих автономных задач: держит фокус, следует инструкциям, не дрейфует. Opus 4.5, по наблюдениям Cursor, склонна останавливаться раньше и срезать углы. При этом разные модели лучше справляются с разными ролями: GPT-5.2 лучше планирует, чем специализированная на коде GPT-5.1-codex.

Главный инсайт команды: промпты важнее, чем выбор модели или архитектура системы. Координация сотен агентов, избегание патологий и удержание фокуса на протяжении недель потребовали долгих экспериментов именно с инструкциями. Система пока не оптимальна — агенты иногда работают слишком долго, а периодические перезапуски нужны для борьбы с "туннельным зрением". Но ответ на главный вопрос оказался оптимистичнее ожиданий: масштабирование работает.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.