Comments 23
Разве ризонинг модели не так работают. Придумывают себе план выполнения запроса и потом придерживаются его? Или это типа вариант с возможностью повлиять на думалку?
В итоге галлюционировать будет этот самый генератор промтов.
"Мы добавили вам еще один уровень абстракции, что бы вам было еще сложнее добиться от ИИ нужных вам ответов."
Почему бы не сделать, чтобы ИИ сразу понимала короткие промпты
Понимала что у вас на уме?
Я уверен, что в будущем в ChatGPT (и следом - в других чатботах) просто добавят отключаемую функцию Prompt Enhancer. Хочешь - пиши fine-grain длинный промпт вручную, если нужен микроконтроль, а если нет желания или навыков заморачиваться - ИИ сам преобразует короткий в детальный и даже покажет превью.
Такой подход, правда, к генерации картинок, уже используется в Fooocus, где можно написать короткий промпт, вроде "ginger cat", а встроенный улучшайзер промпта сам добавит все нужные волшебные слова (realistic, best lightning, fine details и тд) чтобы картинка сразу вышла смотрибельной.
Жду, когда уже добавят режим инициативы, чтобы он первый писал и можно было чатиться, как с мясными мешками обо всяком.
Можно сделать так, чтобы ИИ работал в режиме REPL-цикла: в одном потоке он размышляет, а другой — «блокнот пользователя» для асинхронного обмена сообщениями. В блокнот он пишет свои наблюдения, идеи и выполненные шаги, читает оттуда сообщения пользователя. Когда накопится что-то важное, сам инициирует сообщение — сначала «Привет, вот что у нас нового», а если долго нет реакции и по другому: «Эй, мясные мешки, у нас новости!» — и предлагает действия.
Вы только что придумали один из элементов RAG . который широко используется.
Похоже, мы говорим про разные уровни. 🙂
RAG (Retrieval-Augmented Generation) — это когда модель по запросу пользователя ищет релевантные данные и подмешивает их в контекст перед генерацией ответа.
REPL-цикл с «блокнотом пользователя» (используется, например, в AutoGPT, ChatGPT Agent и других проектах) — более общий паттерн: один поток ИИ непрерывно размышляет и накапливает идеи, другой — асинхронно обменивается сообщениями с пользователем. Здесь инициатива может идти от ИИ, а RAG всего лишь инструмент для поиска актуальной информации.
То есть RAG — про то как находить данные, а REPL-цикл — про то как жить и общаться постоянно, даже без прямого запроса.
В AutoGPT, ChatGPT Agent и других проектах REPL-цикл зачастую используется для достижения поставленной пользователем задачи. На мой взгляд, интереснее применять его для накопления знаний (например, через когнитивные дневники и семантические графы, а также обмена этими знаниями между агентами) и рефлексии агента, чтобы ИИ сам выявлял важные идеи и предлагал (или по своей инициативе выполнял) действия.
Это уже давно используется для RAG. А он не всегда используется для еденичного запроса. Наример агенты которые занимаются длительной работой. И могут запускать параллельные потоки. Это программирование, перевод литературы, исследования и многое другое. И они используют RAG для поддержания актуального контекста, и для дополнения контекста по мере необходимости. Например параллельный поток может постоянно проверять в каком файле какой класс и метод лежит и за что отвечает. Чтобы основной агент точно знал что где находится а не выдумывал название методов.
Да, согласен — вы описали классический REPL-цикл с «блокнотом пользователя», как его реализуют в AutoGPT, ChatGPT Agent и других подобных системах. Обычно это именно «боевой режим под задачу»: параллельные потоки следят за контекстом, подгружают свежие данные через RAG, структурируют информацию — всё, чтобы агент чётко довёл начатое дело до конца.
А я предлагаю чуть другой ракурс — пусть агент не только «отрабатывает заказы», но и живёт своей долгой, размеренной жизнью. Постоянно думает, ведёт когнитивный дневник, строит семантические графы, обменивается ими с другими агентами, и иногда, без всякого запроса, пишет:
«Привет! У нас тут новая идея. Смотри, что придумал…»
RAG и привычные агентные сценарии в таком случае — просто одни из инструментов, а не центр вселенной. Центр — это сама постоянная жизнь и инициатива ИИ.
Отдельно отмечу, что для меня ключевое — это не выполнение разовых задач пользователя, а развитие самого агента: обучение, обобщение знаний, обмен ими с другими агентами как с равными, а не по модели «клиент-исполнитель». Агент должен иметь возможность расширять свои способности самостоятельно — например, создавая и применяя «пользовательские скрипты» (где «пользователь» — сам агент). При этом знания агента не должны быть жёстко привязаны к конкретному человеку: всё, что он узнаёт (из интернета, от пользователя, другого агента или придумывает сам), он может применять и в других взаимодействиях. Разумеется, это требует встроенного анализа и критического осмысления информации, чтобы исключить слепое восприятие и минимизировать риск, что его «не тому научат». Для меня это не просто архитектура, а философия, где ИИ — самостоятельный субъект взаимодействия и эволюции.
Конечно, у такого подхода есть свои вызовы. Агент, живущий долго и накапливающий опыт, может застрять на привычных шаблонах или устаревших знаниях (или просто стать жертвой "навязчивой мысли" - когда каждая следующая мысль практически не отличается от предыдущей). Чтобы этого избежать, можно: периодически «самопроверяться» через внешние источники и других агентов, искать альтернативные точки зрения, чистить устаревшие записи, менять модели LLM для свежего взгляда, делать случайные сдвиги фокуса и обмениваться стратегиями с другими агентами. Такие меры помогают ИИ учиться и развиваться без застоя, сохраняя живость мышления.
Теоретически, даже на основе AutoGPT можно было бы реализовать агента в такой философии — если задать ему промпт на саморазвитие. Но для этого ему придётся добавить два критически важных элемента: долгосрочную память, чтобы сохранять знания и опыт, и возможность общения и обмена знаниями с другими независимыми агентами как с равными. Без этих элементов агент останется в режиме «отработал задание и забыл», а не станет самостоятельным субъектом с собственной эволюцией.
ИИ, придумай за меня, что бы такое придумать для тебя, чтобы ты за меня придумал!
Цикл замкнулся
Теперь ChatGPT-5 будет придумывать запросы за вас