lyakakooy9 июн в 06:34

Codex жрёт контекст? Я дал ему локальную память на SQLite — и перестал кормить его простынями промптов

Средний

11 мин

16K

Open source * SQLite * Веб-разработка * Искусственный интеллектПрограммирование *

Обзор

Из песочницы

+19

Комментарии 28

reallord 9 июн в 10:49

А чем использование БД лучше чем использование AGENTS.md + MEMORY.md ?
Модель все равно читает текст. Просто в одном случае с диска, в другом случае из БД.
Текст одинаковый для анализа моделью, экономии контекста нет.

vitaly_il1 9 июн в 13:40

+1 - хотел задать тот же вопрос

lyakakooy 9 июн в 23:56

Если правильно понял вопрос, тут решалась моя головная боль с промтами между несколькими чатами (разными моими проектами), при этом чтобы кодекс мог учитывать мои прошлые пожелания по структуре и дизайну кода, поэтому все хранится внутри одной системы из которой он черпает эти знания, и нет этих различных файлов

Genius_Russian_Coders 10 июн в 05:23

Похожий подход пробовал с Claude Code — вместо SQLite файловый кэш с эмбеддингами и поиск релевантных кусков кода. Основная боль — инвалидация кэша после рефакторинга. Как у вас с этим?

fedorro 14 июн в 17:07

А я просто попросил Claude запомнить и больше не спрашивать - он себе куда-то в глобальную память записал 😎

Genius_Russian_Coders 10 июн в 09:03

Интересный подход. Я тоже держал контекст в SQLite с эмбеддингами для поиска. Больной вопрос — инвалидация кэша при изменении файлов. Как решаешь эту проблему? У меня — cron на mtime + переиндексация diff'а.

vincentlaw 10 июн в 13:23

Потому что все туда пихать нет смысла, будет перегруз. А если запихнете то далеко не всегда он будет релевантен задаче.

Контекстное окно ограниченно, эффективное ещё меньше (около 60 процентов).

Поэтому контекст должен быть подобран под задачу, должен быть специфичным.

IlyaStroynov 9 июн в 11:10

Работаю с hermes agent, всяких вспомогательных .md хранит кучу, токены улетают сильно быстрее, чем через родной codex cli, есть фичи, типа канбан доски, которые перевешивают.

TecHMeaT 9 июн в 13:26

Я для Hermes сделал память с нативной интеграцией, где есть горячий слой и долговременная память, которая хранится в Obsidian. Это общая память с Claude Code и Codex, все они работают на маке и VPS. Как и у вас используется SQLite с FTS5.

https://github.com/itechmeat/open-second-brain

caveboy 9 июн в 14:22

Я чет прям описание своего проекта прочитал, пописываю потихоньку с февраля, на гитхабе в публичном доступе лежит. (если кому надо ссылку скину, может звездочку поставите :) Думаю, а почему его только боты скачивают, теперь знаю почему:) Если кому интересно, почему БД лучше чем использование AGENTS.md + MEMORY.md могу популярно в нескольких словах объяснить: Маркдаун файлы - это по сути статика, база данных - она живая. Затраты человека или агента на правку этих файлов сильно выше, чем через правильно приготовленный MCP rпростыми командами типа запиши правило X, или подними задачу Y. Более того, постановка задачи автоматизируется, превращаясь в непринужденный диалог с агентом. Кто пишет ручками пишет *.md для агента - срочно поднимайтесь с предыдущей ступени развития вайбкодинга :)
Я вот интервью агента попросил записать:
https://github.com/Utundry/sloplesscode/blob/master/docs/AGENT_MCP_INTERVIEW.md

Inkognitoo 9 июн в 16:54

Все равно не понял, чем бд в этом плане лучше. Запиши правило X в бд или в файл rules.md, в чем будет принципиальная разница?

md файл ещё и версионировать через git удобно и между командой делить проще

caveboy 9 июн в 16:58

В базе данных можно хранить декомпозированно. и доставать только релевантные части

4wards1 9 июн в 18:19

Markdown-файлов можно сделать несколько и связать их ссылками.

Безусловно, если хочется изобрести свой велосипед, то никто ни в силах помешать. Но преимущества этого велосипеда высосаны из пальца и не выдерживают критики.

caveboy 9 июн в 18:31

Не буду спорить, каждый выбирает то, что ему удобно, или то, к чему привык, в крайнем случает, то, к чему принуждают. Сам являюсь сторонником правила: хочешь понять как работает инструмент, сделай его сам.

Mintavrus 10 июн в 05:27

Вопрос ведь был не про удобство и привычки, а про затраты токенов. Я сейчас работаю с md-файлами, и для меня это кажется проще и удобнее. Но хотелось бы понять, может использование БД в этом плане действительно лучше?

caveboy 10 июн в 06:37

Про затраты токенов, они растут экспоненциально размеру проектов. Разные подходы к хранению памяти меняют эту зависимость. И как в графиках системы уравнений. в зависимости от сложности(объема) проекта различные методы имеют разные эффективности. На малых проектах .md достаточно, после определенного объема эффективность падает, либо ломается совсем. Tогда на сцену выходят более сложные методы, типа RAG, Cognition и т.д.

caveboy 10 июн в 07:08

Для тех, кому действительно интересно разобраться, я опубликовал статью
https://dzen.ru/a/aikKRKfi_X16HSoD
опубликовал бы и на хабре, но инваайта нет.

Boyscout1234 9 июн в 14:24

Я работаю по принципу кодекс программист - чатжпт агент. Я написал с помощью него целую софтину сотруднику. И на данном этапе он работает без сбоев и багов. Единственное что на данный момент вношу правки, исправляю баги, дорабатываю ПО. Его память по проекту — это файлы документации внутри репозитория, которые мы специально ведём. А для экономии токенов использую: "Контекст проекта актуален в docs/AI_CONTEXT.md и docs/CURRENT_STATE.md. Прочитай только эти два файла и PATCH_RULES.md." А для маленьких исправлений достаточно "Прочитай docs/AI_CONTEXT.md, docs/CURRENT_STATE.md, docs/PATCH_RULES.md." И я уже прошел релиз, сделал кучу мелких исправлений. И уже расширил функционал, при этом он не сломал ничего при добавлении нового. Только он не всегда помни какие были исправления графический в старом и добавляет эти же самые баги графические в новом функционале.

caveboy 9 июн в 14:55

Отлично, а какой размер проекта в строках?

Vragerr 10 июн в 13:25

На сколько уменьшает потребление токенов при проверке прошлых решений и пр? Я пока делаю через agent. Md + skills + md файлы с документацией,прошлыми решениями, правилами, текущими и будущими задачами и пр и полёт нормальный.

lyakakooy 11 июн в 14:59

Бенчмарков не приведу зависит все от проектов, время на написание промтов экономлю точно на процентов 50

andreyandwine 10 июн в 19:07

Тоже не понял смысла. Клод пишет самари задачи или то что вы прямо попросите сохранить память, он пишет отдельные мд файлы, достаточно подробно, и один мемори файл там очень краткая сводка и ссылка на подробную иструюцию. Т.е. в памяти при старте нового чата лежит только краткий список того что есть в проекте и вызывается как тулинг.

isumix 10 июн в 20:39

А как ищется релевантные данные в памяти для контекста, с помощью ЛЛМ? Ведь простым ГРЕПом не получится, правильно я понимаю?

lyakakooy 11 июн в 14:58

Через полнотекстовый поиск ллмка пытается найти что-то полезное для решения задачи

babim-negev1 11 июн в 05:45

Крутая статья, а рассматривал вариант через MCP Serena?

Он хуже / лучше?

lyakakooy 11 июн в 14:56

Спасибо, Serena или codegraph отличное дополнение к этому всему, как раз чтобы была хорошая навигация по коду, позволяет тоже чуть меньше тратить токены, раньше прогал с serena щас пользуюсь codegraph, насчет лучше хуже не могу сказать, по сути у нас разные проблемы решаются

Farkl 15 июн в 06:09

описанная в Предисловие проблема решается скилами, не понял зачем городить свой велосипед

myks92 16 июн в 09:19

Подскажите, чем это отличается от реализации в Codex? https://developers.openai.com/codex/memories

Зарегистрируйтесь на Хабре, чтобы оставить комментарий