Creatman17 апр в 21:06

Почему ваш AI-агент тратит 80% токенов на файлы, которые уже читал вчера — и как это починить тремя markdown-файлами

Простой

6 мин

15K

Программирование * Искусственный интеллектPython * Лайфхаки для гиков

Туториал

+26

Комментарии 17

НЛО прилетело и опубликовало эту надпись здесь

Creatman 18 апр в 09:31

UPD: Автор Graphify (29K+ звёзд на GitHub) ответил на мой issue, где я предложил четыре фичи для мультипроектной работы — multi-project mode, парсинг сессий Claude Code, поддержку удалённых серверов и компактный режим отчётов.

Все четыре оказались в их роадмапе на v5.0. Особенно заинтересовал парсинг JSONL-сессий — они планируют сделать сессии агента полноценными узлами графа знаний, что совпадает с тем как устроена индексация разговоров в моём подходе.

https://github.com/safishamsi/graphify/issues/425

Issue оставлен открытым как трекер фич, ссылку на репозиторий с иерархией контекста автор Graphify разместил сам. Буду контрибьютить PR по мере готовности — парсеры JSONL уже рабочие.

Dreams_and_magic 18 апр в 21:04

Для Opencode использую AGENTS.md + ARCHITECTURE.md, сейчас добавил Graphify, выглядит прикольно. Hypergrep вроде как слишком мощен для моих масштабов, но выглядит интересно.

Для уменьшения количества токенов в 2 и более раз на Реддите рекомендуют GrapeRoot https://github.com/kunal12203/Codex-CLI-Compact
Там бесплатный тариф Standart до 500 файлов в проекте.

Dobezor 18 апр в 14:56

Спасибо бро 😎

Creatman 18 апр в 14:56

Рад быть полезен!

kuza2000 18 апр в 17:37

Все так. Пришел таким же выводам. Claude.md не пользуюсь, мне захотелось универсальное и чуть более продвинутое решение. В результате родился пакет mcp-memory-bank. Очень простой, суть такая же как у вас.

Очень был удивлен, какой результат может быть достигнут столь простыми средствами. Причем тут не только экономия токенов. С агентами намного проще и приятнее общаться, когда они помнят что это за проект, архитектуру, что делали вчера, до чего договорились и и.д.

bimspecial 18 апр в 20:24

Все классно, но чёт не понял почему речь идёт о трёх файлах? Глобальный Клод и проектный Клод, где третий?

grand_inquisit0r 19 апр в 13:02

я начал решать этот вопрос с клодом и даже поделился с всем тут, но хабр решил, что пусть моя статья ждет с пятницы вечера в песочнице до бесконечности.
как отдуплят, заходите https://habr.com/ru/sandbox/281282/
вместе что-то навояем, а то клод приобнаглел с закручиванием гаек

Creatman 19 апр в 19:26

Советую запастись терпением, коллега. Моя первая покрывалась песком более двух недель…

А на счет гаек, дело даже не в клоде а в общей архитектуре большинства подобных инструментов.

BlackSCORPION 20 апр в 08:59

А еще лучше писать код так чтобы не пришлось спрашивать у агента какие способы оплаты поддерживает ваш бот.

Структурировать код так чтобы сразу было видно какие есть способы оплаты, ну либо как минимум ткнуть агента носом в конкретный файл или пакет чтобы он не грепал весь репозиторий.

Клауде мд не панацея этот системный промпт сам себе жрёт контекст когда надо и не надо, а еще его надо не забывать обновлять.

Такие куски контекста в маркдаун удобнее хранить где то в репозитории и добавлять вручную в чат по необходимости. Я например часто так делаю для переноса контекста, сидишь в чатжпт ресерчишь в свободной форме, в конце просишь подитожить в маркдаун файл, его прикладываешь в клауде агента к чату.

Creatman 21 апр в 10:04

Вы верно рассуждаете, но не совсем поняли контекст. В моей реализации памяти все структурировано так, что я могу открыть любой новый чат Claude Code или даже Claude Desctop (он подключен через MCP к этой памяти) и спросить его о любом нюансе любого своего проекта (платежка приведена как самый простой пример), и через ~15-20 секунд потратив минимальное количество токенов этот чат будет обладать информацией о всей архитектуре проекта и конкретно о том модуле кода где реализуется запрашиваемый объект.

Spyman 23 апр в 15:30

А можете привести каких нибудь реальных примеров из жизни? Мне очень понравилось, что вы сделали тесты (хоть и как-то мало и штучно), обычно авторы таких статей просто говорят что придумали что-то, а работает оно или хуже делает - не поймёшь.

И идея сделать историю чатов звеньями графа знаний это прям хорошо звучит.

Но я толком не понял, какую проблему вы решаете. У вас какая-то специфика работы, когда одновременно ведутся сотни проектов?

Просто в моей практике - достаточно указать точку входу в задачу (можно примерно) и дальше тот-же Клод через зависимости указанные явно в файлах выгребает весь необходимый контекст.

muradali 20 апр в 18:43

А если у меня один проект и я использую openAI то в файле с каким названием мне держать общую информацию по проекту чтобы он его всегда автоматически видел и принимал во внимание. Agents.md?

eugenekoiner 4 мая в 05:29

а ещё есть вот такая штука https://github.com/MinishLab, по идее можно вместе использовать. Кто нибудь пробовал?

shme7ev 13 мая в 05:17

По отдельному проекту вы не пробовали сравнивать результаты c openspec ?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий