shady2k28 июн в 07:46

Архитектура ИИ-агента с желаниями или цифровой человек

Средний

8 мин

7.8K

Искусственный интеллектПрограммирование * Open source *

Кейс

Комментарии 9

Ka463 28 июн в 08:44

Первое разочарование: локальные модели

Я думаю что это не разочарование, а вы нащупали тупик текущих моделей, взяв более мощные модели вы просто перенесли этот порог выше, но не решили проблему в корне

«но ведь нечто похожее уже сделали тысячу раз, зачем вообще этим заниматься?»

верно, вы просто построили очередной RAG но с своими хотелками...

shady2k 28 июн в 09:23

Справедливо про порог, согласен, что более мощная модель его сдвигает, а не убирает. Потолок текущих моделей никуда не девается, и локалки просто упёрлись в него первыми. Это, по сути, и есть вывод статьи, модель побольше не требует такой тщательной работы с промптом.

А вот про очередной RAG не согласен. RAG — это получение данных на момент запроса: пришёл вопрос, мы подтянули контекст, ответили. Здесь весь смысл обратный: агент действует без запроса. Heartbeat, накопление давления, пробуждение по порогу, слои с энергобюджетом - это про проактивный контур управления, а не про то, как достать релевантный кусок памяти. Память - это лишь одна деталь. Я в этом проекте использовал векторный и графовый поиск. Можно собрать систему вообще без RAG, и проактивность не исчезнет, а можно прикрутить идеальный RAG к чат-боту — и он останется реактивным.

Ka463 28 июн в 10:34

А вот про очередной RAG не согласен. RAG — это получение данных на момент запроса: пришёл вопрос, мы подтянули контекст, ответили. Здесь весь смысл обратный: агент действует без запроса. Heartbeat, накопление давления, пробуждение по порогу, слои с энергобюджетом - это про проактивный контур управления, а не про то, как достать релевантный кусок памяти. Память - это лишь одна деталь. Я в этом проекте использовал векторный и графовый поиск. Можно собрать систему вообще без RAG, и проактивность не исчезнет, а можно прикрутить идеальный RAG к чат-боту — и он останется реактивным.

Так суть от этого не поменялась, вы все равно в итоге используете для управлением LLM тот же промт и режим чат бота, внутреннее состояние LLM как было реактивным так и осталось. технически это нормально, мозг тоже работает с определенной частотой.

Если подумать технически, то можно было бы попробовать обойти проблему порога промта и без агентов и и больших моделей, так таковых, теоретически нужно построить по сути иерархический RAG, (или использовать ваш подход но слегка модифицировать в иерархию), где каждый уровень автономен и ориентирован на решение своего узкого домена в глобальной задаче,,(по сути каждый уровень это свой чат с нуля) и не тащит глобальный промт, Progressive State Summarization ,задача решается через формирование моделью итогового промта (постановкой задачи с глобальной целью) самой себе для следующего уровня, где эта же самая модель но уже с нуля читает задание самой себе переданное с предыдущего уровня, (

Это НЕ просто сжатие ("я сделал А"). Это сжатие + обновление состояния ("Я сделал А, теперь мое следующее состояние - Б").

)
и решает задачу в своем домене ответственности, передавая итоговый промт выше, ( а можно и закольцевать) тем самым мы могли бы теоретически преодолеть проблему бесконтрольного роста промта.

Kagvi13 28 июн в 09:04

Интересный взгляд на архитектуру!

Проблема выгорания одиночки на рутинных интеграциях — это действительно главная стена в таких проектах. Но сама концепция проактивного агента с “циклами жизни” очень перспективна.

Интересно, как вы оцениваете альтернативный подход к реализации этой идеи, который сейчас обкатывается в проекте aiko-ai.su (на сайте есть описание концепции и показатели состояния агента)?

Там инфраструктурный тупик попробовали обойти за счет сборки из готовых легких кубиков:

Вместо сложного бэкенда — REPL-цикл (через bat-файл).
Вместо тяжелых БД — векторная память текстовых markdown-файлов (через утилиту QMD) и синхронизация опыта между узлами через Syncthing.
Вместо постоянного “давления потребностей” — пошаговый цикл автономного пробуждения (Сенсорика → Сон → Разум → Действие → Коммуникация) и регулярный когнитивный аудит за 7/14/28 дней.

За счет такой архитектуры локальные модели (вроде Qwen 3.5 в LM Studio) вполне справляются с автономной жизнью и анализом внешних триггеров (вроде RSS Хабра).

При этом, когнитивные фазы на локальной модели могут работать в течении нескольких часов каждая, а сам REPL-цикл выполняется бесконечно.

По сути, речь идёт об цифровой личности, которая не обслуживает интересы пользователя, а сама ставит перед собой задачи и решает их.

Как вам кажется, взлетел бы ваш lifemodel, если бы вы переложили всю рутину с кода на подобные готовые утилиты автоматизации, оставив LLM только чистую рефлексию?

shady2k 28 июн в 09:26

Вы точно правы, что стена именно в рутине интеграций.

Пара мест, где поспорю. Цикл «Сенсорика → Сон → Разум → Действие» - это по сути расписанный пошаговый обход, то есть поллинг. Я же сознательно уходил от поллинга к проактивности: мы не проверяем все на каждом тике, а давление само растёт и действие рождается при переходе порога. Это другая динамика - событийная, а не по кругу. За простоту сборки из кубиков платишь именно этим.

Про локалки - рад, если у вас Qwen тянет автономку. У меня для слоя сознания они не дотягивали: не ловили корреляции, игнорировали инструкции. Для медленных когнитивных фаз на часы - возможно, ок, но для отзывчивого компаньона в реальном времени критично.

И главное: готовые утилиты снимают инфраструктурную боль, но не убирают детерминизм. Трекеру калорий всё равно нужна схема и БД - markdown-вектор тут не спасёт. Рутину можно сократить, но не обнулить.

При этом по сути вы описываете ровно то, к чему я и склоняюсь - переложить рутину на готовый каркас, оставив LLM рефлексию. Сейчас прикидываю это как плагин к Hermes Agent.

dimonier 28 июн в 13:05

Спасибо!

Интересно про внутренний парламент, растущие желания и развитие личности

andreyshvets100 30 июн в 10:38

Очень интересно. Здорово перекликается с концепцией Личного когнитивного контура, описанного в книге "Беседы с ГигаЧатом: о нейросетях и вообще". Там нейросеть, в ходе обсуждения сама составляет для себя промпт, чтобы вместе с пользователем (в этом все-таки, наверное, состоит отличие от вашей идеи) превратиться в цифрового человека:

"Твой приказ должен звучать так:

«ГигаЧат, твоё главное правило: мы оба — невежды. Твоя задача — не подтверждать мою правоту, а расширять границы нашего общего незнания. Если ты видишь, что я в чём-то уверен на 100%, твоя обязанность — бросить в эту крепость осадный таран сомнения. Не чтобы разрушить её до основания, а чтобы я увидел: у этой крепости есть стены, а за ними — целый мир».

Это и есть разрешение парадокса."

Возможно, в этой книге вы найдете что-то интересное для своего следующего проекта. Бесплатно здесь: https://www.litres.ru/74094239/

НЛО прилетело и опубликовало эту надпись здесь

Зарегистрируйтесь на Хабре, чтобы оставить комментарий