Pull to refresh

Comments 20

После каждого шага /continue, отмечает шаг сделанным в чеклисте, делает коммит и встает на паузу, ожидая ревью от человека. После запуска /continue переходит к следующему шагу.

Вот это тема, я тоже пришёл к "интерактивному" режиму. Идём маленькими шагами, ревью после каждого шага.

Это работает как FSM алгоритм, ничего нового тут нету. Любую задачу можно запилить полностью из запланированных конструкций, а ии будет лишь человеком, который выбирает. Но в итоге останутся архитекторы, ну а потом и их ге будет и будем молиться богу машины.

Да чёт пока не верю. Либо ИИ творит дичь и нужен постоянный контроль. Или нужна спецификация размером с код.

Есть ещё область больших трат и длительной автономной работы, но я там ещё не бывал.

Или нужна спецификация размером с код.

По моим ощущениям и по общению с опусом х1.5 - х2 спецификации к коду это норм, считается хорошим выходом (ROI).

х1.5 - х2 спецификации к коду это норм

Спека в 2 раза больше чем код?

Пока самое полезное по теме ИИ что доводилось читать на хабре

Очень похоже работаю, только есть кое что покруче TDD - это BDD

А так - только ежовые руковицы в виде куалити гейтс (проверка на any, тайпскрипт, размер файла - у меня 800 строк)

И за эту статью тоже покорнейше благодарю, занес себе фреймворк на "изучить".

Подскажите пожалуйста, как по вашим ощущениям выросло время исполнения средней задачки на фреймворке против "наивного промпт-вайб-кодинга"?

НУ и прожорливость по токенам...

По моим ощущениям оно растет прям кратно, ну то есть это цифры порядка х5... х10.

И это понятная история. Текущий уровень LLM хоть и потрясает воображение, но все еще не способен охватить все сразу ЗА ОДИН проход - и задачу, и продукт, и технологию, и качество кода, и архитектуру, и тесты... и что там еще нам нужно.

Вот и приходится сжечь кратно болше токенов чтоб он "вернулся и подумал" обо всем этом. Этакий "внешний ризоинг на стеройдах" я это называю. Ведь внутренний ризонинг он именно про это - чтоб модель поговорила сама с собой и расширила кругозор по задаче, все LLM-кодинг фреймворки они в общем то про то же самое, просто что б этот диалог продолжился еще дольше и с разных точек зрения (продукт, качество, код стайл, архитектура...)

Подскажите пожалуйста, как по вашим ощущениям выросло время исполнения средней задачки на фреймворке против "наивного промпт-вайб-кодинга"?

Да бог его знает. Раза в 3-4, наверное.

НУ и прожорливость по токенам...

По моим ощущениям оно растет прям кратно, ну то есть это цифры порядка х5... х10

Я бы тоже в таких порядках оценил. Там больше всего жрут чек-листы, по которым Фреймворк проходит.

До внедрения чек-листов мне хватало $100 подписки и в параллель я вёл 3-4 сессии. После - впритык $200 и 6 сессий. Значит, одни только чек-листы увеличили потребление токенов в 5 раз и время исполнения - в 2 раза.

Но, полагаю, и качество выдаваемого кода возрасло после чек-листов кратно.

Возросло, но не кратно. В целом, чек-листы оказались одним из самых неоднозначных решений: вроде бы дорефачить до конца я бы мог и сам, это дело пары минут, а потребление токенов при этом сильно выше. Но, поскольку этап ревью предполагает чтение кода, мне очень важно было, чтобы код был легко читаем. Ну и мне не нравится оставлять на человека то, что можно автоматизировать.

Очень круто и детально. Спасибо - сохранил в закладки для постоянного использования.

Тут в соседнем посте флексят своими настройками, я пока экспериментирую со своим приложением с UI на workflows, чтобы эти /continue жать кнопками или голосом

По поводу prompt update я пришел вот на днях к схеме, когда работает агент, и когда он заканчивает, у него последним пунктов в чек листе стоит команда postmortem которая описывает правило, если ты в этой сессии упирался к примеру на ошибку которая потом была выявлена статическим анализатором, то запиши ее в специальную джира тикет как комментарий. Раз в неделю или чаще, будем просматривать и обновлять скилы, руками или еще одним другим скилом (командой).

Не хватает видосиков демонстраций, надоело читать про успешный успех. Можно же было продемонстрировать на отдельном примере работу в действии, но нет мы должны потратить время, и еще задонатить в клода 200 бачей. Спасибо за легкий вход. Ну и тема с командами работала еще во времена Sonnet 3.0, и тогда 2-2.5 года назад он нормально справлялся с задачами.

Привет. Да, меня уже попросили сделать демо, так что будет видос очень скоро.

Sign up to leave a comment.

Articles