Немного насчет - «AI-агенты сделают разработку самоподдерживаемой».

Прогнал spec-driven агентный пайплайн на нескольких проектах, и картина каждый раз одна: узкое место, где тормозится разработка, не исчезает, оно сдвигается.

Для примера, один из таких полигонов - небольшой проект, приложение для книг на виртуальных полках, начинался как пет-проджект жены. В нем можно толкать агентные воркфлоу сильно дальше, чем я бы рискнул на нагруженном проде.

Как это работает на практике:

  • Я задаю намерение. Claude Code набрасывает спеку, я проверяю/правлю, дальше по необходимости рулю текстом или голосом. Агенты исполняют, направление держу я.

  • Claude Code и Claude Design пишут код и UI по спекам (DDD, TDD, Trophy Testing), ревью на каждом изменении.

  • AI гоняет regression и пишет E2E через MCP Playwright, прод-ошибки возвращаются через MCP Sentry.

  • Периодически Claude Code сам делает выводы в insights-inbox - где споткнулся, какие паттерны зашли. Еженедельная рутина обрабатывает их вместе с настройками агента, даёт предложения сразу по всем проектам (и user-level). Так что правила самого агента со временем становятся точнее.

Что не автоматизируется - это решение, что вообще нужно строить, и отслеживание, когда агент тихо уходит в сторону. Зелёные тесты не равны корректности: агент с большей вероятностью напишет проходящий тест, который проверяет не то.

Так что главная работа теперь - намерение и отлов дрейфа в сторону от этого намерения.

Контур не замыкается сам на себя. Он просто поднимает человека выше, на слой, где решаешь, что строить и справилась ли с этой задачей машина. Этот слой в ближайшем будущем не исчезнет, и это одна из интереснейших вещей. Инженерия не пропала - она стала даже сложнее написания кода.
А без сильного инженерного подхода проекты на AI-агентах расползаются по швам.

PS: тот самый проект book-shelves.ru: TypeScript, React, Vite, Tailwind, Node.js, NestJS, PostgreSQL, MinIO S3, Vitest, Testcontainers, Playwright, Sentry, Caddy, Nginx