Ну хз, у меня родственник так печень потерял, послушал большинство, и пересадили печень, после пересадки выяснился что диагноз был неточный и пересадка была не нужна.
А вот про очередной RAG не согласен. RAG — это получение данных на момент запроса: пришёл вопрос, мы подтянули контекст, ответили. Здесь весь смысл обратный: агент действует без запроса. Heartbeat, накопление давления, пробуждение по порогу, слои с энергобюджетом - это про проактивный контур управления, а не про то, как достать релевантный кусок памяти. Память - это лишь одна деталь. Я в этом проекте использовал векторный и графовый поиск. Можно собрать систему вообще без RAG, и проактивность не исчезнет, а можно прикрутить идеальный RAG к чат-боту — и он останется реактивным.
Так суть от этого не поменялась, вы все равно в итоге используете для управлением LLM тот же промт и режим чат бота, внутреннее состояние LLM как было реактивным так и осталось. технически это нормально, мозг тоже работает с определенной частотой.
Если подумать технически, то можно было бы попробовать обойти проблему порога промта и без агентов и и больших моделей, так таковых, теоретически нужно построить по сути иерархический RAG, (или использовать ваш подход но слегка модифицировать в иерархию), где каждый уровень автономен и ориентирован на решение своего узкого домена в глобальной задаче,,(по сути каждый уровень это свой чат с нуля) и не тащит глобальный промт, Progressive State Summarization ,задача решается через формирование моделью итогового промта (постановкой задачи с глобальной целью) самой себе для следующего уровня, где эта же самая модель но уже с нуля читает задание самой себе переданное с предыдущего уровня, (
Это НЕ просто сжатие ("я сделал А"). Это сжатие + обновление состояния ("Я сделал А, теперь мое следующее состояние - Б").
) и решает задачу в своем домене ответственности, передавая итоговый промт выше, ( а можно и закольцевать) тем самым мы могли бы теоретически преодолеть проблему бесконтрольного роста промта.
Я думаю что это не разочарование, а вы нащупали тупик текущих моделей, взяв более мощные модели вы просто перенесли этот порог выше, но не решили проблему в корне
«но ведь нечто похожее уже сделали тысячу раз, зачем вообще этим заниматься?»
верно, вы просто построили очередной RAG но с своими хотелками...
Ну хз, у меня родственник так печень потерял, послушал большинство, и пересадили печень, после пересадки выяснился что диагноз был неточный и пересадка была не нужна.
Так суть от этого не поменялась, вы все равно в итоге используете для управлением LLM тот же промт и режим чат бота, внутреннее состояние LLM как было реактивным так и осталось. технически это нормально, мозг тоже работает с определенной частотой.
Если подумать технически, то можно было бы попробовать обойти проблему порога промта и без агентов и и больших моделей, так таковых, теоретически нужно построить по сути иерархический RAG, (или использовать ваш подход но слегка модифицировать в иерархию), где каждый уровень автономен и ориентирован на решение своего узкого домена в глобальной задаче,,(по сути каждый уровень это свой чат с нуля) и не тащит глобальный промт, Progressive State Summarization ,задача решается через формирование моделью итогового промта (постановкой задачи с глобальной целью) самой себе для следующего уровня, где эта же самая модель но уже с нуля читает задание самой себе переданное с предыдущего уровня, (
Это НЕ просто сжатие ("я сделал А"). Это сжатие + обновление состояния ("Я сделал А, теперь мое следующее состояние - Б").
)
и решает задачу в своем домене ответственности, передавая итоговый промт выше, ( а можно и закольцевать) тем самым мы могли бы теоретически преодолеть проблему бесконтрольного роста промта.
Я думаю что это не разочарование, а вы нащупали тупик текущих моделей, взяв более мощные модели вы просто перенесли этот порог выше, но не решили проблему в корне
«но ведь нечто похожее уже сделали тысячу раз, зачем вообще этим заниматься?»
верно, вы просто построили очередной RAG но с своими хотелками...