Комментарии 7
Первое разочарование: локальные модели
Я думаю что это не разочарование, а вы нащупали тупик текущих моделей, взяв более мощные модели вы просто перенесли этот порог выше, но не решили проблему в корне
«но ведь нечто похожее уже сделали тысячу раз, зачем вообще этим заниматься?»
верно, вы просто построили очередной RAG но с своими хотелками...
Справедливо про порог, согласен, что более мощная модель его сдвигает, а не убирает. Потолок текущих моделей никуда не девается, и локалки просто упёрлись в него первыми. Это, по сути, и есть вывод статьи, модель побольше не требует такой тщательной работы с промптом.
А вот про очередной RAG не согласен. RAG — это получение данных на момент запроса: пришёл вопрос, мы подтянули контекст, ответили. Здесь весь смысл обратный: агент действует без запроса. Heartbeat, накопление давления, пробуждение по порогу, слои с энергобюджетом - это про проактивный контур управления, а не про то, как достать релевантный кусок памяти. Память - это лишь одна деталь. Я в этом проекте использовал векторный и графовый поиск. Можно собрать систему вообще без RAG, и проактивность не исчезнет, а можно прикрутить идеальный RAG к чат-боту — и он останется реактивным.
А вот про очередной RAG не согласен. RAG — это получение данных на момент запроса: пришёл вопрос, мы подтянули контекст, ответили. Здесь весь смысл обратный: агент действует без запроса. Heartbeat, накопление давления, пробуждение по порогу, слои с энергобюджетом - это про проактивный контур управления, а не про то, как достать релевантный кусок памяти. Память - это лишь одна деталь. Я в этом проекте использовал векторный и графовый поиск. Можно собрать систему вообще без RAG, и проактивность не исчезнет, а можно прикрутить идеальный RAG к чат-боту — и он останется реактивным.
Так суть от этого не поменялась, вы все равно в итоге используете для управлением LLM тот же промт и режим чат бота, внутреннее состояние LLM как было реактивным так и осталось. технически это нормально, мозг тоже работает с определенной частотой.
Если подумать технически, то можно было бы попробовать обойти проблему порога промта и без агентов и и больших моделей, так таковых, теоретически нужно построить по сути иерархический RAG, (или использовать ваш подход но слегка модифицировать в иерархию), где каждый уровень автономен и ориентирован на решение своего узкого домена в глобальной задаче,,(по сути каждый уровень это свой чат с нуля) и не тащит глобальный промт, Progressive State Summarization ,задача решается через формирование моделью итогового промта (постановкой задачи с глобальной целью) самой себе для следующего уровня, где эта же самая модель но уже с нуля читает задание самой себе переданное с предыдущего уровня, (
Это НЕ просто сжатие ("я сделал А"). Это сжатие + обновление состояния ("Я сделал А, теперь мое следующее состояние - Б").
)
и решает задачу в своем домене ответственности, передавая итоговый промт выше, ( а можно и закольцевать) тем самым мы могли бы теоретически преодолеть проблему бесконтрольного роста промта.
Интересный взгляд на архитектуру!
Проблема выгорания одиночки на рутинных интеграциях — это действительно главная стена в таких проектах. Но сама концепция проактивного агента с “циклами жизни” очень перспективна.
Интересно, как вы оцениваете альтернативный подход к реализации этой идеи, который сейчас обкатывается в проекте aiko-ai.su (на сайте есть описание концепции и показатели состояния агента)?
Там инфраструктурный тупик попробовали обойти за счет сборки из готовых легких кубиков:
Вместо сложного бэкенда — REPL-цикл (через bat-файл).
Вместо тяжелых БД — векторная память текстовых markdown-файлов (через утилиту QMD) и синхронизация опыта между узлами через Syncthing.
Вместо постоянного “давления потребностей” — пошаговый цикл автономного пробуждения (Сенсорика → Сон → Разум → Действие → Коммуникация) и регулярный когнитивный аудит за 7/14/28 дней.
За счет такой архитектуры локальные модели (вроде Qwen 3.5 в LM Studio) вполне справляются с автономной жизнью и анализом внешних триггеров (вроде RSS Хабра).
При этом, когнитивные фазы на локальной модели могут работать в течении нескольких часов каждая, а сам REPL-цикл выполняется бесконечно.
По сути, речь идёт об цифровой личности, которая не обслуживает интересы пользователя, а сама ставит перед собой задачи и решает их.
Как вам кажется, взлетел бы ваш lifemodel, если бы вы переложили всю рутину с кода на подобные готовые утилиты автоматизации, оставив LLM только чистую рефлексию?
Вы точно правы, что стена именно в рутине интеграций.
Пара мест, где поспорю. Цикл «Сенсорика → Сон → Разум → Действие» - это по сути расписанный пошаговый обход, то есть поллинг. Я же сознательно уходил от поллинга к проактивности: мы не проверяем все на каждом тике, а давление само растёт и действие рождается при переходе порога. Это другая динамика - событийная, а не по кругу. За простоту сборки из кубиков платишь именно этим.
Про локалки - рад, если у вас Qwen тянет автономку. У меня для слоя сознания они не дотягивали: не ловили корреляции, игнорировали инструкции. Для медленных когнитивных фаз на часы - возможно, ок, но для отзывчивого компаньона в реальном времени критично.
И главное: готовые утилиты снимают инфраструктурную боль, но не убирают детерминизм. Трекеру калорий всё равно нужна схема и БД - markdown-вектор тут не спасёт. Рутину можно сократить, но не обнулить.
При этом по сути вы описываете ровно то, к чему я и склоняюсь - переложить рутину на готовый каркас, оставив LLM рефлексию. Сейчас прикидываю это как плагин к Hermes Agent.
Спасибо!
Интересно про внутренний парламент, растущие желания и развитие личности
Очень интересно. Здорово перекликается с концепцией Личного когнитивного контура, описанного в книге "Беседы с ГигаЧатом: о нейросетях и вообще". Там нейросеть, в ходе обсуждения сама составляет для себя промпт, чтобы вместе с пользователем (в этом все-таки, наверное, состоит отличие от вашей идеи) превратиться в цифрового человека:
"Твой приказ должен звучать так:
«ГигаЧат, твоё главное правило: мы оба — невежды. Твоя задача — не подтверждать мою правоту, а расширять границы нашего общего незнания. Если ты видишь, что я в чём-то уверен на 100%, твоя обязанность — бросить в эту крепость осадный таран сомнения. Не чтобы разрушить её до основания, а чтобы я увидел: у этой крепости есть стены, а за ними — целый мир».
Это и есть разрешение парадокса."
Возможно, в этой книге вы найдете что-то интересное для своего следующего проекта. Бесплатно здесь: https://www.litres.ru/74094239/

Архитектура ИИ-агента с желаниями или цифровой человек