Search
Write a publication
Pull to refresh

Comments 9

Да, айди в туду списке были бы достаточны, возможно это ограничение модели?

Возможно, полная передача списка нужна, чтобы он совершенно точно не вымывался из контекста. Кроме того сравнение передаваемого туда-сюда списка позволяет поймать самые страшные галлюцинации и разрушение контекста. Возможно, что этот список сравнивается или предполагается, что он будет сравниваться каким-то инструментом.

По крайней мере я бы именно так сделал, чтобы ловить моменты, когда ИИ полностью оторвался от реальности и потерял контекст - в этом случае у него поплывёт выдаваемый обратно todo.

Там нет сравнения, попросил его на последнем шаге удалить предыдущие todo и оставить последний шаг, система это пропустила, был лист из 5-ти действий, оставила одно.


Т.е. у агента есть возможность редактировать Todo по мере выполнения задачи, добавлять шаги, удалять, изменять. И это с одной стороны понятно, ведь агент мог что-то не учесть. Но все-таки это должно происходить более контролируемо.

Кинул в чат claude инструмент TodoWrite, тоже пошел генерировать весь список задач, и даже шаги, которым он не меняет статус.

"Полное описание всех инструментов с параметрами я выложил на GitHub — ссылка доступна в моем Telegram-канале."

А вот это отдельное дно. Докатились до того, что ссылку на собственный GitHub выкладывают не статью, а в свой сраный телеграм канал. Это, как минимум, неуважение к читателям.
На хер такие статьи вне зависимости от их ценности, потому что вот так Хабр в помойку и скатился.
Потому и минус.

Спасибо за разбор. Весь цикл выполнения с самого начала на примере реальной задачи интересно было бы посмотреть - какие промпты, параметры передаются, как он определяет какие файлы надо прочитать.

Добавьте task-master в пайплайн работы, и будет у вас передаваться только текущая задача в туду

Спасибо большое автору за статью, было интересно посмотреть как ведет себя модель на примере реальной задачи. Очень интересен следующий топик статьи. Жду с нетерпением! Удачи!

Sign up to leave a comment.

Articles