Comments 7
В вашем ТГК ничего нет =) Какой от него толк, если все новости и подобные посты мне приходится искать самому здесь вручную? =)
Что-то я не вижу тут «программисты не нужны». Кто все это настраивать будет?
Просто в очередной раз поменяется формат работы - такое уже проходили от перфокарт до современных Java, Go, C# и IDE.
до "1. tab complete" был еще нулевой уровень - просто чатиться с нейронкой, вместа гуглежа по stackoverflow :)
Хороший овервью. Во всём этом есть одна проблема - исходим из того, что PRD проработанный и однозначно верный и не требует дальнейшей проработки после написания. Что чаще всего не так. Для полноценной разработки не хватает циклов приёмки/уточнения промежуточных результатов.
Хороший обзор. По уровню 5-6 хочу добавить момент, который обычно всплывает позже: когда агент начинает реально ходить по продакшн-сайтам, headless-браузер довольно быстро детектится. Сайт отдаёт другой контент, показывает капчу или тихо блокирует сессию. Агент при этом формально "завершает задачу", но работает не с теми данными.
Для внутренних инструментов это не проблема. Но как только агент взаимодействует с внешними сервисами - это реально больная точка, которую в уровнях не упоминают.
Когда команда Anthropic выкатывает продукт вроде Cowork за 10 дней, а другая команда не может довести до ума сломанный POC на тех же моделях,
Абсолютно не корректное сравнение, с учётом того, что Вам никто не скажет сколько эти самые Антропики потратили своих токенов.
8 уровней агентной инженерии