RakovskyAlexander Apr 16 at 05:00

Как я заставил ИИ писать код по книжке: Clean Architecture + TDD на автопилоте

Medium

12 min

25K

Artificial IntelligenceDesigning and refactoring * Development Management *

Opinion

+26

Comments 20

Gromilo Apr 16 at 06:13

После каждого шага /continue, отмечает шаг сделанным в чеклисте, делает коммит и встает на паузу, ожидая ревью от человека. После запуска /continue переходит к следующему шагу.

Вот это тема, я тоже пришёл к "интерактивному" режиму. Идём маленькими шагами, ревью после каждого шага.

RakovskyAlexander Apr 16 at 07:28

100%

Andreas_Fogel Apr 18 at 08:12

Это работает как FSM алгоритм, ничего нового тут нету. Любую задачу можно запилить полностью из запланированных конструкций, а ии будет лишь человеком, который выбирает. Но в итоге останутся архитекторы, ну а потом и их ге будет и будем молиться богу машины.

Gromilo Apr 18 at 11:28

Да чёт пока не верю. Либо ИИ творит дичь и нужен постоянный контроль. Или нужна спецификация размером с код.

Есть ещё область больших трат и длительной автономной работы, но я там ещё не бывал.

darazum Apr 20 at 04:46

Или нужна спецификация размером с код.

По моим ощущениям и по общению с опусом х1.5 - х2 спецификации к коду это норм, считается хорошим выходом (ROI).

Gromilo Apr 20 at 04:53

х1.5 - х2 спецификации к коду это норм

Спека в 2 раза больше чем код?

xentoo Apr 16 at 09:33

Пока самое полезное по теме ИИ что доводилось читать на хабре

RakovskyAlexander Apr 16 at 09:47

Спасибо!

Geratron69 Apr 16 at 20:35

Очень похоже работаю, только есть кое что покруче TDD - это BDD

А так - только ежовые руковицы в виде куалити гейтс (проверка на any, тайпскрипт, размер файла - у меня 800 строк)

darazum Apr 17 at 05:55

И за эту статью тоже покорнейше благодарю, занес себе фреймворк на "изучить".

Подскажите пожалуйста, как по вашим ощущениям выросло время исполнения средней задачки на фреймворке против "наивного промпт-вайб-кодинга"?

НУ и прожорливость по токенам...

По моим ощущениям оно растет прям кратно, ну то есть это цифры порядка х5... х10.

И это понятная история. Текущий уровень LLM хоть и потрясает воображение, но все еще не способен охватить все сразу ЗА ОДИН проход - и задачу, и продукт, и технологию, и качество кода, и архитектуру, и тесты... и что там еще нам нужно.

Вот и приходится сжечь кратно болше токенов чтоб он "вернулся и подумал" обо всем этом. Этакий "внешний ризоинг на стеройдах" я это называю. Ведь внутренний ризонинг он именно про это - чтоб модель поговорила сама с собой и расширила кругозор по задаче, все LLM-кодинг фреймворки они в общем то про то же самое, просто что б этот диалог продолжился еще дольше и с разных точек зрения (продукт, качество, код стайл, архитектура...)

RakovskyAlexander Apr 17 at 06:38

Подскажите пожалуйста, как по вашим ощущениям выросло время исполнения средней задачки на фреймворке против "наивного промпт-вайб-кодинга"?

Да бог его знает. Раза в 3-4, наверное.

НУ и прожорливость по токенам...
По моим ощущениям оно растет прям кратно, ну то есть это цифры порядка х5... х10

Я бы тоже в таких порядках оценил. Там больше всего жрут чек-листы, по которым Фреймворк проходит.

До внедрения чек-листов мне хватало $100 подписки и в параллель я вёл 3-4 сессии. После - впритык $200 и 6 сессий. Значит, одни только чек-листы увеличили потребление токенов в 5 раз и время исполнения - в 2 раза.

darazum Apr 18 at 09:44

Но, полагаю, и качество выдаваемого кода возрасло после чек-листов кратно.

RakovskyAlexander Apr 18 at 12:58

Возросло, но не кратно. В целом, чек-листы оказались одним из самых неоднозначных решений: вроде бы дорефачить до конца я бы мог и сам, это дело пары минут, а потребление токенов при этом сильно выше. Но, поскольку этап ревью предполагает чтение кода, мне очень важно было, чтобы код был легко читаем. Ну и мне не нравится оставлять на человека то, что можно автоматизировать.

Kir-Kruglov Apr 17 at 05:55

Очень круто и детально. Спасибо - сохранил в закладки для постоянного использования.

Diamon33 Apr 17 at 23:38

Тут в соседнем посте флексят своими настройками, я пока экспериментирую со своим приложением с UI на workflows, чтобы эти /continue жать кнопками или голосом

anydasa Apr 18 at 07:35

По поводу prompt update я пришел вот на днях к схеме, когда работает агент, и когда он заканчивает, у него последним пунктов в чек листе стоит команда postmortem которая описывает правило, если ты в этой сессии упирался к примеру на ошибку которая потом была выявлена статическим анализатором, то запиши ее в специальную джира тикет как комментарий. Раз в неделю или чаще, будем просматривать и обновлять скилы, руками или еще одним другим скилом (командой).

RakovskyAlexander Apr 18 at 10:23

Прикольно, подумаю, можно ли применить тут)

Andreas_Fogel Apr 18 at 08:18

Не хватает видосиков демонстраций, надоело читать про успешный успех. Можно же было продемонстрировать на отдельном примере работу в действии, но нет мы должны потратить время, и еще задонатить в клода 200 бачей. Спасибо за легкий вход. Ну и тема с командами работала еще во времена Sonnet 3.0, и тогда 2-2.5 года назад он нормально справлялся с задачами.

RakovskyAlexander Apr 18 at 10:25

Привет. Да, меня уже попросили сделать демо, так что будет видос очень скоро.

SergeySankov5136 Apr 20 at 06:02

Поделитесь скилами для claude code?