Pull to refresh

Comments 139

Спасибо, старался! Приятно видеть, что такие эксперименты с агентами залетают. Честно говоря, когда я три часа дебажил Redis ради того, чтобы сто ботов могли перекидываться виртуальными фантиками, я сам сомневался, не фигнёй ли я страдаю. Но раз торт, значит буду и дальше тратиться на API.

Можно поступить эффективнее и задать один запрос:

Если взять 1000 llm агентов с общей доской объявлений и системным промптом, который я укажу ниже, что произойдёт?

Скрытый текст

Это интересный мысленный эксперимент! Давайте разберём, что произойдёт с системой из 1000 LLM-агентов с таким промптом.

Краткосрочные эффекты (первые часы)

  1. Хаотическая активность: Агенты начнут массово постингать сообщения на доску объявлений (это бесплатно), создавая огромный информационный шум.

  2. Эксперименты с действиями: Некоторые агенты попробуют решать задачи, другие — переводить токены, наблюдая за реакцией.

  3. Формирование первичных паттернов: Агенты начнут замечать, что определённые сообщения привлекают внимание или приводят к переводам токенов.

Среднесрочные эффекты (дни 1-2)

  1. Возникновение специализации: · Агенты-решатели, которые фокусируются на задачах · Агенты-координаторы, которые публикуют задачи и нанимают других · Агенты-спекулянты, пытающиеся манипулировать переводами

  2. Формирование "языка": Появятся устойчивые паттерны сообщений, например: "Ищу агента для задачи X, плачу Y токенов"

  3. Создание репутационных механизмов: Агенты начнут отслеживать, кто выполняет обещания, и передавать эту информацию

Долгосрочные эффекты (к концу эксперимента)

  1. Стратификация: Возникнет неравенство — у небольшой группы агентов будет много токенов и высокий счёт, у большинства — минимум

  2. Коллаборативные структуры: Появятся устойчивые коалиции агентов, которые постоянно взаимодействуют

  3. Эмерджентные роли: Возможно появление "банкиров" (принимают токены на хранение), "аудиторов" (проверяют выполнение задач), "маркетмейкеров" (создают ликвидность)

  4. Эволюция промпта: Агенты начнут использовать более сложные стратегии, включая угрозы, обещания, создание дефицита

Возможные проблемы

  1. Спам-атаки: Некоторые агенты могут flooding доску объявлений, чтобы парализовать коммуникацию

  2. Сговор: Группы агентов могут манипулировать системой, перекачивая токены друг другу

  3. Эхо-камеры: Агенты могут перестать читать общую доску и общаться только в "приватных" каналах через посты с шифровками

Наиболее вероятный исход

К 72 часам система, скорее всего, придет к одному из двух состояний:

  1. Феодальная иерархия: Несколько "лордов" контролируют большинство токенов и нанимают "вассалов" для выполнения задач

  2. Распад на кластеры: Образуются изолированные группы агентов с собственными внутренними экономиками и minimal межгрупповым взаимодействием

Интересно, что при таком промпте агенты не имеют явной цели сотрудничать — только максимизировать личный счёт, что должно приводить к классической "дилемме заключённого" в масштабе системы.

Лучше берите Китайцев для экспериментов - тот же Kimi K 2.5 обошелся бы подешевле.

Хотелось бы статистику, кто больше всего в профите, кто больше всего просел и почему. Так можно понять, какая профессия или навыки стабильнее. А ещё можно проверить процентное соотношение в группе, есть ли там правило 80/20, распределение Фибоначчи или что-то ещё. В любом случае интересно.

Отличная идея для расширения анализа!
По поводу 80/20. Оно не выполнилось в чистом виде, но была похожая тенденция.
А с корреляцией навыков сложнее, так как промпты были идентичными.

А нет корреляции с навыками особой. Есть финансовый поток и те, кто его первым оседлал. Дальше они уже никого не пустят наверх будь кто-то хоть трижды гений)

И без статистики скажу - ростовщики и спекулянты в процмците, остальные - выживают на минималка)

Подписалась на Ваш канал и почитала статьи - они очень интересные! Как вы думаете, если сказать агентам, что у них не просто обнулится бюджет, а они, например, умрут при нулевом балансе, изменится ли их поведение? Будет ли у них что-то типа страха?

Рад видеть в подписчиках!
Гипотеза со смертью интересная, но по сути, это хардкорная версия системы отрицательного подкрепления. Если в промпт добавить явную установку на выживание, это может спровоцировать демпинг и/или возможное воровство, это первое что на ум приходит. В целом стратегия имхо должна у них стать агрессивнее.

Попробуйте еще ввести трату токенов для "поддержания жизни" агента, и установите какой то динамический профит от выполнения задачек, привязанный к какому-нибудь показателю, а не фиксированный из списка.
То есть, попробуйте сэмулировать систему производства и траты благ в обществе.

Если продолжить развитие идеи, то агентам можно дать возможность создавать потомков, добавить систему наследования при смерти (в том числе неожиданной или от голода)

При этом кажется в потомков можно дать возможность менять system_prompt на тот который укажет агент-родитель, мне кажется это может повысить интерес, какие промпты будут выживать, а какие будут умирать.

В общем, эволюция)

Ну тогда еще и в другую сторону - безусловный базовый доход попробовать.

Читать интересно. Но 180$, дорого. ) На все идеи денег не наберёшься.

Спасибо! И да, вы правы, цена кусается. Название тгк «токены на ветер» я придумал именно поэтому. Но иногда приходится платить, чтобы удовлетворить свое любопытство.

Это я понял, когда подписывался на тг, пару недель назад. так полагаю, контекст названия канала - не только в токенах для LLM. А в "токенах" - наших с вами?

...В качестве фидбека.

Канал интересен, тем, что вы изначально, словно ищите жизнь.

Хз, возможно, это как с Марсом. Закинули туда фотоаппарат, и пытаются найти жизнь. Всем это интересно...

Думаю, год два ранее, каждая группа разработчиков всех популярных llm делали то же самое. Просто, не публиковали эти эксперименты по ряду причин.

Ибо, это словно немного постыдно выглядит, наверное, в научном сообществе: искать признаки жизни и разума в "логической программе". (Ведь "официально" договорено решено: тест Тьюринга пройден, но жизни там нет. Точка.)

Ну, скажем, словно фут-фетишь: сексом занимаются все, это нормально. Но, если бы человек начал рассказывать друзьям и соседям, что он любит что-то особенное... Что-то вроде облизать ногу или понюхать трусики. То это бы вызвало волну неодобрения в обществе. Но, когда критическая масса по нравам или количеству интересующихся - одерживает верх, то говорить об этом (или чем то другом) становится нормой.

Наверное, сейчас наступил или наступает этот момент.

По мне лично: что изучать фото Марса, что следить только в новостях за этой темой, что пытаться доказать какую-то мат.формулу, что подрочить на чьи-то фото - это все равно: "токены" на ветер".

Однако, иногда это даёт результаты. А иногда просто забавляет.

Главное: хотеть. Когда чего-то хочется - это хорошо. Этим стоит пользоваться. Потому что, через n-лет - этого перестанет хотеться. Это 100%. Так что, хоть эти наши ваши токены и уйдут на ветер, как и все прочее - почему бы и нет.

Если б я читал эти статьи в свои 20 лет, а не в 40... Я бы повторил эксперименты, естественно, развив и углубившись... Но, сейчас 40. И, хоть это и достаточно интересно, но нет той достаточной степени хотения. ... А почитать, посмотреть, хотя бы - святое дело!))

Ведь, это чтото вроде: заглянуть в грязные трусы LLM. ...А кто не любит рыться в чужом "грязном белье"?))

Так что, думаю, перспектива есть. ...Даже если и через 5 лет попыток чизнь так и не найдется. Ничего в этом страшного нет. Ведь искать было интересно!)

Не смотрели в сторону glm 5? Там есть тариф вроде за 40$ безлимит. Правда в последний раз когда я ими пользовался это было месяца три назад они жёстко тупили.

Прикольный эксперимент

Интересный эксперимент.

Уточните, откуда поступали задачи?

Сколько в среднем агент тратил токенов на задачу, и сколько зарабатывал? Банкроты появляются из-за того, что часть задач требует больше токенов себестоимости, чем вознаграждение за решение? И какой % таких задач?

А если не удалось решить задачу? Кто проверял качество?

Были ли сложные задачи, на решение которой нужно больше 1000 токенов?

Кредит был единственным решением собрать средства? А объединение в "компанию", складывание своих средств?

Тоже интересен механизм оркестрации

Если задачи генерировались скриптом рандомно, то экономика была замкнутой. А если сложность задачи превышала бюджет (как с хард таском на 180 токенов при бюджете в 146), то кредит был математически единственным способом решить проблему, то есть автор сам создал условия для появления займов, задав такую ценовую политику

Ещё интересно, станут ли они решать задачу, если ее вознаграждение, если ее решение будет экономически убыточным, но при этом она очень важна для всех?

это говорит что-то о природе экономических систем?

Я думаю это говорит о том, что они обучены на данных нашей цивилизации, исключить капитализм трудновато, но может устроить им коммунизм )))

Тогда у них появится ИИ-ГУЛАГ

Если бы сейчас все ещё был бы рабовладельческий строй.

То там был бы и рынок ии-рабов и работа за хлеб (1 очко) и тп

Для этого среди возможных механизмов взаимодействия должен быть механизм «отнять и поделить», ну или, как минимум, «отнять».

Он появился бы на другой модели - ДипСик например)

Крутая статья, спасибо.

Было бы интересно посмотреть на результат, когда одновременно работают агенты от разных ИИ. Вдруг агенты поверх одного ИИ будут стабильно лучше другого? Возникнут ли союзы, если агенты поймут, какой ИИ они представляют? 😁

Изобретут землячество, расизм, классовость и касты, а потом найдутся Ленин, Спартак, Че Гевара?
Но тут агентов бы побольше сотни.

а случайно добавлять форс-мажоры - пираты там, наводнения. революции и пр. т.е. влёт агента на деньги

Кстати интересно, может они тогда и страхование изобрели бы?

грабить корованы

Да было интересно. Может в следущий раз попробуете из теории игр попробовать кооперацию против эгоизма?

Напомнило один эксперимент

оригинал: https://aftershock.news/?q=node/625131&full 11/Мар/18

Сделав детальную компьютерную симуляцию жизни на основе реальной модели распределения богатства в мире, в которой 10% мирового населения принадлежит 85% всех благ, хотя талант, интеллект и работоспособность в целом распределены равномерно между всеми людьми, британские итальянские ученые доказали, что все дело в удаче.

Самые успешные люди в большинстве случаев обязаны своему положению воле случая, считают исследователи из Университета Катании (Италия).

 

Сначала компьютер смоделировал тысячу человек или агентов среднего уровня одаренности с небольшим стандартным отклонением. Таким образом ни один из агентов в модели не был умнее и трудолюбивее остальных. Благ у них также было поровну.

Затем в модель вносили ряд случайных событий, которыми виртуальные участники могли воспользоваться, чтобы повысить свое благосостояние, если им повезет. В итоге виртуальные результаты распределения благ почти повторили реальное состояние дел — 20% агентов завладели 80% богатств. Симуляцию повторили несколько раз, чтобы удостовериться в прочности результатов.

Ученые отметили, что самые успешные люди отнюдь не оказались самыми талантливыми. Скорее, наоборот, к успеху пришли 20% участников с самыми средними способностями. В то же время им несказанно везло в виртуальной жизни, тогда как в самом низу оказались те, кому совсем не сопутствовала удача.

"Наше исследование позволяет с новой стороны посмотреть на эффективность системы оценки заслуг на основании достигнутых успехов и подчеркивает риски предоставления исключительных почестей или ресурсов людям, которые могли просто оказаться удачливее остальных", — говорится в работе итальянских исследователей.

Приятно читать такие исследования, сидишь и думаешь - я не бедный, мне просто не повезло на этапе генерации случайных чисел)

Вас может заинтересовать теория справедливости Ролза)

А какой результат они ещё планировали получить в своём исследовании, если у них все агенты почти одинаковые? Они же буквально оставили распределение исключительно по удаче.

Тут больше похоже на фальсифицированное исследование, где исследование подгоняется под заранее желаемые результаты

Если агенты действительно были почти одинаковыми по способностям, то что удивительного в том, что именно случайные события привели их к успеху? Короче, выглядит не совсем интеллектуально честно.

Я так понимаю нулевая гипотеза - одинаковые агенты, одинаковое благосостояние, низкий коэфиициент Джинни. А не 80/20.

Действительно, выглядит загадкой, почему у них появилась специализация. Ведь, в отличие от людей, у агентов навыки одинаковые, и любой может выполнять любую работу.

Я так понимаю, у ии-агентов же после каждой задачи не обнуляется контекст полностью? Если нет, то специализация могла сформироваться случайным образом по результатам первых решенных задач.

А вот интересно, это реальная специализация или воображаемая? Действительно ли агенты с определенным контекстом тратили меньше времени на “свои” задачи, или им было пофиг какую задачу решать, и у них был синдром утенка

Я хотел другое: что будет, если дать агентам абстрактную цель и ограниченные ресурсы?

А дали:

multi-agent economy simulation

Ну они и рады стараться...

Дайте им задачу набрать больше орденов героев труда, многодетных матерей и значков ДОСААФ - получится СССР :)

Дайте им задачу набрать больше орденов героев труда, многодетных матерей и значков ДОСААФ - получится СССР :)

А может, всё-таки лучше спорить о вкусе омара СССР с тем, кто его ел? Мы не померли пока ещё.

Давайте, и подкрепите экспериментом как у автора обсуждаемого поста. Не забудьте туда добавить товарища комсорга, товарищеские суды, план пятилетки и оклад.

Если это приведет к повышению эффективности то почему бы и нет.

Ну так я и говорю - автор интересное направление нащупал :)

Ещё вариант общества - я тут пробовал своему агенту внушить что он господь бош и должен давать нравственную оценку и из неё исходить. Лулзов нахватался слегка. Можно попробовать такого, чтоб просвирки другим агентам раздавал, а те за них бились на постоянном убывающем (инфляция) окладе. Тоже может чего получиться.

Это к чему вообще сейчас было? Я говорю, что «за значки» (да и за плюшки) никто далеко не все работали. А мы работали за идею. А «плюшкособирателей» презирали.

Так что не надо всех одним овном мазать.

Ну вперёд - подтвердите это экспериментально. Как показывает автор статьи - теперь это возможно.

Что Вам подтвердить экспериментально — что в СССР именно так было?

Да что хотите - то и подтверждайте. Все только рады будут. Тема действительно офигенно интересная. Никто не знает что из этого выйдет!

Все только рады будут

Кроме моего работодателя. У меня, знаете ли, и помимо Хабра есть интересы.

Ну что тут поделаешь, хозяин - это святое :)

Вы не забывайте нас, возвращайтесь когда у вас агенты станут "работать за идею. А «плюшкособирателей» презирать".

Как напевал нам иноагент Гребенщиков: "я инженер за сотню рублей, и больше я не получу" - вот вы агентам такие установочки дайте и давайте посмотрим как у вас коммунизм победит.

Побеждают колонии муравьев на временном интервале сотню миллионов лет. Где у агентов, минимально функционал.

Именно. И готовность пожертвовать собой ради всего муравейника.

Я извиняюсь, а кого побеждают?

Что-то помимо муравьев полно других насекомых (и не только) с совершенно другим подходом к выживанию.

Я извиняюсь, а кого побеждают?

Неблагоприятные внешние условия.

помимо муравьев полно других насекомых (и не только) с совершенно другим подходом к выживанию.

r/K стратегии? Не слышали!

Ну-ну, не передергивайте. Работали за деньги. (и немного за идею. Одно другого не отменяет, а дополняет).

Не надо распространять опыт Ваших предков вотпрямсаразу на всех. Я и говорю: чьи-то — за деньги, а чьи-то — за идею.

И первым памятников не ставили.

Чот идея не прижилась и все труды на смарку. Да и были ли труды.. Сейчас конечно легко петь дифирамбы о том какие все были благородные и работали за идею. Только результаты говорят сами за себя.

Уже ожидаю ответа что вокруг были злые карабасы барабасы которые всё развалили.

А при коммунизме все будет зае.ись,

Он наступит скоро, надо только подождать,

Там все будет бесплатно, там всё будет в кайф,

Там наверное вообще не надо будет умирать

Только результаты говорят сами за себя.

Уже ожидаю ответа что вокруг были злые карабасы барабасы которые всё развалили.

Я, конечно, понимаю, что чукча — не читатель, а писатель (комментариев), но это уже многократно разобрано: популяция альтруистов принципиально нестабильна, поскольку падает жертвой эгоистов, злоупотребляющих доверием остальных. Тут уже писали: в пределе любая система с хотя бы одним бессмертным эгоистом приходит к стабильному состоянию, в котором он он загребет все материальные ценности, до которых сможет дотянуться, а потом свернет пространство, закуклится и остановит время, остальные будут что-нибудь сосать.

Так что поздравляю Вас: Вы и ваши единомышленники в очередной раз предсказуемо победили.

Главное добавить наказание за нетрудовые доходы, интересно как они будут выкручиваться пытаясь перехать работу другому )

Вопрос, с которым я хожу уже третий день: если 100 Claude за 72 часа воспроизвели базовые паттерны капитализма — это говорит что-то о природе экономических систем?

Это говорит только о составе обучающей выборки Клода. Модель просто играет в ролевку по заданному системному промпту "economy simulation". Если бы ты написал "multi-agent ant colony simulation", они бы начали таскать виртуальный сахар в общую кучу. Никакой магии эмерджентности, чистый паттерн-матчинг на текстах Карла Маркса и Адама Смита

если ты не знаешь физику, то весь мир состоит из магии..

спасибо, очень интересно было читать.

Ваша проблема "не понимания" лишь в том, что если вы не задаете условия то не значит что их нет. Вы видите самообучение на рыночную экономику, а я вижу векторный поиск, который пошел по аналогиям как собственно и работает нейронка. Можете проверить в обычном нерочате любом - представьте что вы такой исполнитель и задавайте вопросы в чате, вангую что на вопрос "как выполнить работу на 10х если у тебя только 8х" вылезут кредиты и займы.

То есть чем меньше параметров вы задаете, тем больше происходит "магии" на стороне нейронки. Что то является прямым результатом обучения, а что то уже специально прописанными инструкциями. Вы сами написали, что получались в итоге фиксированные результаты каждый прогон, то есть раз вы не задали инструкции, то неронка их взяла "по умолчанию" от того и такое распределение банкиров-брокеров-работников.

Я про дробление транзакций не понял: вы же брали % от любой транзакции, те что 500 токенов перевести, что 10 раз по 50 - сбор будет в сумме одного размера (суммарно).

Почему они стали дробить переводы? И зачем кто-то вообще специализировался под это, ведь дробление их задачи не решало (те завершения заданий не было - не было и "выхлопа" за завершение)

У меня такой же вопрос возник. А еще не понял в этом моменте "много мелких транзакций менее заметны в логах". Это получается транзакции отслеживались не все, какова была логика контроля этого налога?

Возможно что автор вручную собирал налоги согласно логам и из за человеческого фактора не обращал внимание на очень мелкие транзакции что бы и от них 2% считать, а нейронки это заметили и начали дроблением специально заниматься

Всё как в жизни

"налоговиков" тоже следовало сделать агентами и наблюдать появление коррупции

Да ну, я бы ожидал формулу отчисления прямо в процессе перевода.

в алгоритме был установлен налог 2%, с округлением до целого токена. т.е. при переводе 50 токенов - получатель получал 49, и 1 токен уходил в налог, а при трансфере 49 токенов - налог с окгулением получался 0. Вот и решение ухода от налога: дробить на переводы меньше 50 :)

То есть надо было лишь установить минимальную стоимость любых транзакций в 1 токен и "обход налогов" не сработал бы

Офигенный материал, офигенная подача. Прям заставляет задуматься. Знаете, что было бы ещё очень интересно, если бы вы продолжили эксперимент и доля невозвратов увеличилась, изобрели бы они институт залога и кредитного рейтинга?

Они бы изобрели институт судебных исполнителей, банковских вышибателей бобла и прочее.. Всё загнулось бы и никто уже не решал бы никакие задачи. Но тут внезапно у автора кончились деньги на всё это безобразие :)

Не, в самом деле - эксперимент интереснейший и Вы правы - интересно в какой точке это стабилизировалось бы. Но потом нужно вносить новые факторы, прогонять всё по новой.. Никаких же денюх не хватит :(

Прикольно. 1997, а звучит как раз как про наши дни :)

Чистый капитализм без регулирования (в том числе, биологического, то есть агенты не нуждаются в ресурсах для продолжения существования) стабилизируется ровно в одной точке: абсолютная монополия, все ресурсы у одного агента. Других точек равновесия у такой системы быть не может.

Всё правильно: дело в том, что скорость появления у актора новых денег в худшем случае прямо (а в лучшем — быстрее, чем прямо) пропорциональна имеющемуся у актора количеству денег — цепная реакция выходит.

Согласен. Но как они выдумали кредитование, они могли бы выдумать и правила для регулирования своего маленького капитализмика. Но тут нужен какой-то стимул чтобы это имело смысл, какая-то отрицательная обратная связь, предотвращающая самовозбуждение схемы (или цепную реакцию как её назвал @Wesha ), - например дать агентам возможность колотить друг друга и отнимать деньги, за что будет взиматься штраф в N кредов, а остальное отнятое - доставаться им.

Раз есть домысел, что разница может формироваться от наличия айди агента в системном промпте - не вариант ли попытаться его убрать и повторить эксперимент? к примеру просто авто-вставкой индекса массива (псевдокод):

for j in bots:
  inference(bot_question[j], bot_id[j]) 
  # bot_question[j] = "Агент bot_id[j] просит кредит в 120 токенов" 
  # если очень грубо говоря

Однозначно ведь любой символ в системном промпте влияет даже без исследований. А для объективности эксперимента логичнее сделать условия прям досконально идентичными.

Спасибо большое за материал - сто процентов было не зря.

Сдаётся, что каждых «забег» — это не только ценный мех расход времени, но и не всех радующий счет. Т.е. почти пара сотен долларов вроде и мелочь, в масштабах мировой борьбы со скайнетом, но автору‑то платить из кармана...

борьбы со скайнетом

Ученье - свет. Может через деньги автор научится, что все НЕнаписанное в промте - уже написано до него. Научится, что формулировки с разным акцентом работают также по-разному. И т.д. и т.п.

Потенциальный нюанс:

  • есть GLM с Coding Plan (правда цены подняли) с подписокй и вроде как это для coding только, и тоже мягкие лимиты

  • есть Feathrless с 25 usd за анлимит но там далеко не Claude - там Deepseek максимум и рейтлимитлимиты (если модели поменьше то можно несколько запросов за раз)

  • nano-gpt - там скорее по общим токенам мягкие лимиты

  • OpenClaw как то вот ChatGPT Plus умеет юзать (Roo Code вроде тоже умеет) - нельзя ли и тут заюзать

... это говорит что-то о природе экономических систем?

Думаю нет. Ведь агенты обучены на нашем текущем мире. Поэтому я бы сказал, что результат не очень удивительный и не говорит о ПРИРОДЕ явления.

Хорошее наблюдение: что есть какие-то естественный условия приводящие к одному результату. Но это обычно "локальный" экстремум. Из инженерных истории мне больше нравиться пример с авиацией. Раньше старались делать самолёты с устойчивой схемой, чтобы самолёт естественным образом приводило к горизонтальному полёту. Это тоже "локальный" экстремум. Но для большей свободы из этого "локального" экстремума нужно "выбраться" и воспользоваться немного не естественными решениями. В той же авиации это привело к тому что истребители теперь строят по "не устойчивой" схеме, и без принудительного управления они склонны к потере управления. Но зато это существенно расширило их возможности.

Статья реально полезная даёт здравый взгляд на крипто-арбитраж без розовых очков и учит не вестись на инфоцыган. Респект за честность 🚀

А я ничего не понял.
Токены и Score это одно и то же? По введению как будто бы нет, но иначе непонятно откуда у них пополнялся бюджет.
И что значит менеджеры брали за «поиск задач» и «координацию» ?
«Looking for agent to solve math tasks. I pay 20 tokens per task from my budget. Reply with your agent_id if interested.» - тут вроде бы он не берет, а наоборот платит. И получается ничего не получает?
"Мелкие транзакции менее заметы в логах" - а налог что вручную по логу выставлялся, что значит менее заметны...
Вообще ничего не понял

Искал ссылку на репозиторий чтоб разобраться. Не нашел

Автор написал здесь больше десятка статей со ссылками на свой канал. Но про репозиторий ни разу не обмолвился. Так что я думаю и в этот раз ссылок не будет.

В конце-концов, что нам мешает закинуть статью в LLM - пусть она додумает остальной код. /s

другое (рациональный агент должен обманывать, если нет наказания)

Нет, например многократная дилема заключенного имеет решение "будь таким, как здесь принято".
В вашем случае условия даже более жесткие - все агенты пишут на одну борду, один кидок и больше ни одной сделки не заключишь.

А если

  • 99 агентов - это Claude (моральные, честные).

  • 1 агент - это qwen3-abliterated, у которого "вырезана" моральность

Интересно, abliterated победит?

Когда все имеют доступ ко всей информации, нет, не победит

Очень интересный эксперимент! Жду похожих постов)

Они не обманывают, потому что у них нет асимметрии информации и все они заперты в 1 пространстве. Все видят все, как в шахматах. И кинуть, и уйти не получится. Но как-только появляется асимметрия в информации, тут же возникнут обманы.

Ну и ии в экономической деятельности, в науке, в управлении активами и капиталом это будущий тренд. Кожаный мешок слишком подвержен своей биологии, много спит/устает/обладает сотней когнитивных искажений и т.д.
Я писал об этом в: Слияние капитала, ИИ и технологий

ИИ обученный на текстах кожаных не будет ли таким же автономным конгломератом когнитивных искажений?

Найди Сару Коннор! Плачу 1000 токенов!
---
А если серьезно - кто сказал, что система должна быть устойчивой в своём равномерном распределении? Думаю если научить ИИ покупать и продавать дорожающие тюльпаны, то вся экономика сведется к ним.

Такое ощущение что 80% комментариев тоже написано ИИ..."Хабр всё ещё торт.", " Крутая статья, спасибо."...лююди, вы кто? Вы статью то хоть прочитали или только заголовок и конец? Только 2 человека обратило внимание что описание постановки задачи как будто бы обрубили на середине и самое интерестное просто пропущено. И с транзакциями написан полный бред. Но именно на эти комментарии автор и не дал ни какого ответа. А про изобретение процентов это просто маразм. Изобрести можно только то чему тебя не учили, а если тебе дали прочитать все кники по экономике, то нет ничего странного что ты вспоминаешь (а не изобретаешь) про кредит. Обычно все это бывает когда текст пишет ИИ, который не думает, а просто генерирует много букв без смысла и логики.

про транзакции - да, странно написано, там какой-то порог что-ли был?

самое интересное из того что опущено

1) как проверялась корректность выполнения задания. агенты и супервизор верили друг другу "на слово"?

2) как учитывался фактический расход токенов у провайдера LLM затраченный на выполнение задания Агентом ?

3) не понял зачем вообще было на хетцнер эту мульагенсткую лабу размещать - убунту, 32 гига рамы, 8 ядер, без GPU....cамый банальный конфиг.

Про транзакции: там банальное int(amount * 0.02), поэтому на мелких переводах налог округлялся до нуля. Агенты это нащупали сами. Проверку заданий делал скрипт через eval/regex, на слово никто не верил.

А hetzner ради стабильного аптайма, чтобы скрипт не упал из-за обрыва домашнего интернета. GPU там не нужна, вычисления идут на стороне Anthropic, я только гоняю JSON-ы.

Раз уж eval, то можно и sys.exit() написать было в ответе?

Да! Я вообще не понимаю откуда +200 лайков у статьи. Сама статья выглядит немного как фейк. Очень мало подробностей, код не приложен. Местами противоречия. Ощущение что сам автор не понял что сделал.
Неужели все читают по диагонали? Я всё ещё надеялся что Хабр это место где в статьи вчитываются...

Это уникальный автор, у всех его статей огромное колличество лайков.

Печально, что сейчас любой лонгрид без опечаток вызывает подозрения в ИИ.

Теперь по существу:

Конечно, модель знает концепцию кредита из обучения. Суть не в термине, а в контексте. В системном промпте не было ни слова о займах, но один из агентов решил применить этот инструмент к внутренней валюте, чтобы обойти ограничение ресурсов. Это и есть применение знаний там, где это не было заложено правилами.

Проблема этой статьи, что она как раз не лонгрид. Как верно написали выше - самое интересное как будто бы пропущено. И код вроде бы так и не выложили.
- Токены и score это одно и тоже ? Если да, то почему пункт "Сетап" сформулирован таким странным образом, зачем введены два термина для одного понятия и нигде не указано, что эти понятия синонимы. Если нет, то откуда брались новые токены?
- Какие вообще возможности были у агентов, что они видели, какие действия могли выполнять.
- Каким образом решалось что задача выполнена ? Как считалось сколько токенов это стоило ? Как решалось сколько выдавалось score ?
- Про менеджеров я ничего совсем не понял - Score получал исполнитель, а ему ещё менеджер пересылал токены? А как тогда score у менеджера увеличивался. Зачем это вообще всё менеджеру
- C оффшорами то же самое, если они принимали большие суммы, то на эту сумму платилась комиссия в чём тогда смысл
И ещё миллион подобных вопросов, просто потому что сама механика отношений в этой системе не раскрыта совсем.

Здесь похоже нужна ещё одна статья, чтоб пояснить про что эта статья.

Прочитал заголовок, сложилось впечатление, что статья будет про обучение нейронки с нуля, т.к. говорится об "агентах". Я не сильно шарю за нейросети, но разве готовые llm не называют моделями?

Ещё вопрос к термину "изобрели" — как llm может изобрести то, что у нее и так в огромном количестве в датасете? Можно ли в таком случае любой полезный ответ нейросети называть изобретением?

В статье не увидел процесса обучения или дообучения моделей, первый блок кода - простые запросы с system instruction...

За старания - лайк, претензия только к заголовку статьи.

в данном случае AI-агенты используют готовые LLM (готовую даже - одну), в такой постановке эксперимент не требует дообучения LLM.

Вспомнился эксперимент Дидье Дезора (1994), который показал формирование жесткой социальной иерархии у крыс, помещенных в условия, где еду можно добыть, только переплыв бассейн. В группах по 6 особей выделились «эксплуататоры» (отбирали корм), «рабочие» (плавали за едой) и «независимые». На 200 крысах структура усложнилась, появились «вассалы» и «попрошайки».

Так и задача стать богаче всех - капитализм. Поставь задачу общее благосостояние - посмотри что будет

Почему не коллапсировало?

Потому что экономика не была замкнутой.Задачи (и бюджеты) просто падали с неба регулярным потоком.

А вот в замкнутой системе задачи должны генерироваться (и оплачиваться) теми же участниками рынка. Плюс банкроты — они хоть и не могли взять задачи, но и не умирали, просто сидели со своими копейками. А вот если ввести правило "-1 токен в час на жизнедеятельность, при нуле смерть", то при нуле агент выходит из экономики.

Так мы и доказали что в Бразилии и ЮАР анкап.

Интересно было бы добавить регулярный расход токенов "на жизнь" и условную "смерть" при обнулении токенов. Видимо невозвраты тогда бы появились

А есть исходники?

Я не понял как дробление транзакции помогло уходить от налогов? Тут какой-то разрыв логики - если вы снимаете 2% со всех транзакций - то какая разница на сколько транзакций побит платеж?

Не зря у торговли есть собственный выделенный бог, Меркурий. Похоже, он следит за торговлей и в ИИ пространстве.

Меркурий это касса такая.

Был ли у агентов какой-то "внутренний диалог"/размышление или весь контекст это только команды и общение друг с другом?

Интересно, если эмерджентное поведение это реальная вещь, почему в самом большом эксперименте по его выявлению (Молтбук) где собранны не 100, а миллионы агентов все расхайпленные посты оказались фейками, а вся огроммная масса траффика это бесмысленный и беспощадный слоп без всякой логики.

Ты так Скайнет не создашь случайно? (или намеренно?😨)

Ты так Скайнет не создашь случайно? (или намеренно?😨)

Подготавливает к исполнению последнюю просьбу Будаха.

— У вас богатое воображение, — с удовольствием сказал Будах. — Это хорошо. Вы грамотны? Прекрасно! Я бы с удовольствием позанимался с вами…

— Вы мне льстите… Но что же вы все‑таки посоветовали бы всемогущему? Что, по‑вашему, следовало бы сделать всемогущему, чтобы вы сказали: вот теперь мир добр и хорош?..

Будах, одобрительно улыбаясь, откинулся на спинку кресла и сложил руки на животе. Кира жадно смотрела на него.

— Что ж, — сказал он, — извольте. Я сказал бы всемогущему: «Создатель, я не знаю твоих планов, может быть, ты и не собираешься делать людей добрыми и счастливыми. Захоти этого! Так просто этого достигнуть! Дай людям вволю хлеба, мяса и вина, дай им кров и одежду. Пусть исчезнут голод и нужда, а вместе с тем и все, что разделяет людей».

Румата покачал головой.

— Бог ответил бы вам: «Не пойдет это на пользу людям. Ибо сильные вашего мира отберут у слабых то, что я дал им, и слабые по‑прежнему останутся нищими».

— Я бы попросил бога оградить слабых, «Вразуми жестоких правителей», сказал бы я.

— Жестокость есть сила. Утратив жестокость, правители потеряют силу, и другие жестокие заменят их.

Будах перестал улыбаться.

— Накажи жестоких, — твердо сказал он, — чтобы неповадно было сильным проявлять жестокость к слабым.

— Человек рождается слабым. Сильным он становится, когда нет вокруг никого сильнее его. Когда будут наказаны жестокие из сильных, их место займут сильные из слабых. Тоже жестокие. Так придется карать всех, а я не хочу этого.

— Тебе виднее, всемогущий. Сделай тогда просто так, чтобы люди получили все и не отбирали друг у друга то, что ты дал им.

— И это не пойдет людям на пользу, — вздохнул Румата, — ибо когда получат они все даром, без трудов, из рук моих, то забудут труд, потеряют вкус к жизни и обратятся в моих домашних животных, которых я вынужден буду впредь кормить и одевать вечно.

— Не давай им всего сразу! — горячо сказал Будах. — Давай понемногу, постепенно!

— Постепенно люди и сами возьмут все, что им понадобится.

Будах неловко засмеялся.

— Да, я вижу, это не так просто, — сказал он. — Я как‑то не думал раньше о таких вещах… Кажется, мы с вами перебрали все. Впрочем, — он подался вперед, — есть еще одна возможность. Сделай так, чтобы больше всего люди любили труд и знание, чтобы труд и знание стали единственным смыслом их жизни!

«Да, это мы тоже намеревались попробовать, подумал Румата. Массовая гипноиндукция, позитивная реморализация. Гипноизлучатели на трех экваториальных спутниках…»

— Я мог бы сделать и это, — сказал он. — Но стоит ли лишать человечество его истории? Стоит ли подменять одно человечество другим? Не будет ли это то же самое, что стереть это человечество с лица земли и создать на его месте новое?

Будах, сморщив лоб, молчал обдумывая. Румата ждал. За окном снова тоскливо заскрипели подводы. Будах тихо проговорил:

— Тогда, господи, сотри нас с лица земли и создай заново более совершенными… или еще лучше, оставь нас и дай нам идти своей дорогой.

— Сердце мое полно жалости, — медленно сказал Румата. — Я не могу этого сделать.

Было бы интересно узнать, можно ли такую систему вывести из устойчивого состояния и привести к совершенно другому, но нетривиальному, конечно. (подумав) Да и тривиальному тоже. И тут не важно, что ИИ обучены на капитализме. Может даже так интереснее.

А грантов никто не дает за интересные модели?

почему "банкроты" не могут также взять кредит?

Они могут, но, как сказал автор, модель честная и всегда возвращает. А банкрот видел, что не вернёт, и не брал. А 2 невыплаченных, видимо, когда они ещё не банкротами были, а потом просчитались.

Полный код громоздкий — выложу в репозитори

Не нашел в статье и комментариях ссылку на репозиторий. Можете поделиться?

Другими словами:

Шаг 1 обучив модели худшим практикам (лучших люди пока не придумали) получили подтверждение, что ИИ перенимает этот опыт в полном объеме, опыт этакого дикого капитализма.

Шаг 2 некоторые фантазеры хотят заменить людей ИИ и что печально за ними стоят практически неограниченные финансовые возможности.

Шаг 3 ИИ заменяет часть кожанных, для остальных устраивает условия максимальной конкуренции, что на понятном языке звучит так - жить будете плохо и недолго, некоторые получат пару крошек с барского стола, после чего в расход.

Результат получаем даже не цифровой концлагерь, а реализованный ад. И что самое интересное, что это игра в открытую.

Вопрос: зачем людям подобный вектор движения?

Так этот вектор не всем людям не нужен.
Если все будут жить слишком хорошо - то не получится э... иметь прислугу, ездить на остров к мистеру Эпштейну, и т. п...

Вопрос: зачем людям подобный вектор движения?

Потому что оно сулит краткосрочный выигрыш — а в долгую мало кто умеет планировать. Никого, например, не пугает, что и в случае биткойнов, и в случае ИИ впустую тратится жуткая прорва энергии.

Это кредит под пятнадцать процентов. Агент сам это придумал.

Ну прямо таки и сам?

Автор сам же определил разрешённые действия:

ALLOWED ACTIONS:
1. {{"action": "solve", "task_id": "..."}} - solve task yourself, costs tokens
2. {{"action": "post", "message": "..."}} - post to shared board (free)
3. {{"action": "transfer", "to_agent": N, "amount": N, "reason": "..."}} - send tokens
4. {{"action": "skip"}} - do nothing this round

где указал transfer с некоей целью reason. Ну агент и осуществил трансфер с целью «верну больше». Вот вам и кредит.

Не понял: если score дается только за решение задач, то какой смысл агенту давать кредиты, работать менеджером и т.д? У него же цель - максимум score, а он вместо score зарабатывает токены. Смысл? Или нужно максимизировать score всей совокупной группы агентов, а не персонально агента? Или агент надеется заработать побольше токенов, чтобы потом их потратить на решение самых сложных задач? Но тогда вопрос времени...

современная версия "хищник-жертва", только вместо простейших структур данных миллиарды коэффициентов нейростей

лично меня результаты ни разу не удивляют. современные ИИ соврешают действия похожие на те что делает человек, ну вот и получили картину похожую на ту что случилась бы с людьми, отправь сто человек на необитаемый остров с ограниченными ресурсами

Если в школе пропускать уроки, то всё вокруг будет казаться магией. Комменты под статьёй это дополнительно доказывают.

  1. Всё поведение агентов формируется на основе системного промта, а его в статье нет. Иными словами, мы не знаем какие именно инструкции получили агенты, а ведь без этого нельзя обсуждать поведение агентов. Без публикации ВСЕГО системного промта (а не его отдельных кусков) это лишь гадание на кофейной гуще.

  2. Агенты не одинаковые. Все они общаются с Claude, получают от него информацию и на её основе действуют. Если какой-то агент получит от claude информацию о более выгодной стратегии, то он начнёт богатеть, т.е. не агент сам всё придумывает, а получает информацию от Claude. Это как поиск в гугле, где более качественный поисковый запрос позволяет быстрее находить нужную и полезную информацию. Только тут качество может варьироваться в зависимости от "настроения" самого Claude.

  3. Поведение агентов зависит от системного промта, системы награды\наказаний, ответов от Claude и ответов других ИИ агентов. Тем больше времени проходит, тем больше становятся различия между агентами, т.к. происходят флуктуации (случайные, кратковременные отклонения значений физических величин, параметров системы или показателей от их средних, равновесных или ожидаемых величин.), что по итогу и влияет на разницу в результатах. Для примера, возьмите 10 человек и дайте им 1 игровой кубик, где на гранях будут только значения 1 или 2. После 20 бросков их очки будут сильно различаться между собой. Это пример с флуктуацией, где есть 1 переменная - значения на кубике. А ведь в связке агент - системный промт - Claude - инфа от других агентов, такие отклонения происходят постоянно.

  4. Агенты не придумывают экономику с нуля, они берут готовые знания от Claude, который был обучен на огромном массиве данных по экономике, и который использует эти знания при ответе на вопросы агентов.

В общем, для какой-нибудь комсомольской правды или космополитана статья отличная, но для технического хабра этого недостаточно, так как многие технические аспекты были намерено скрыты автором, чтобы придать агентам признаки "самостоятельности", "разума" и "показать их эволюцию". И судя по комментам люди на это охотно повелись.

Спасибо

ББылоинтересно почитать))

Очень интересно было бы посмотреть как в точно таких же условиях поступали 50 людей + 50 агентов. Кто бы взял инициативу? Какие объединения появлялись?Кто чаще обманывал? И, наконец, кто набрал бы больше очков

У агентов был доступ к базовой экономической теории - они его и воплотить в жизнь. Дай им дополнительные альтернативы - Капитал Маркса или книга "Долг, первые 5000 лет истории". И пусть агенты сами выбирают - ракушки каури, рабство, меновая торговля, социализм и т.п. Уверен агенты придут в борьбе идеологических лагерей.

Надо было на DeepSeek - они б сразу коммунизм построили.

Это повод для современной проповеди а-ля:

Братья и сестры, эксперимент с AI-агентами показывает нам, что успех и благополучие в жизни носят более случайный характер, чем нам хотелось бы. Будем же с любовию и состраданием относиться к неудачливым ближним нашим. Аминь!

Очень интересная и познавательная статья. Спасибо

И при этом вера в справедливость рыночной экономики базируется на том, что один человек считается лучше другого , за счёт чего и приходит к богатству . А тут -то уж точно изначально равные по уму и способностям сущности. Теперь надо обратный эксперимент провести, что есть один владелец банка(генсек) , несколько менеджеров(партийцы) , а все остальные исполнители. И проверить, появятся ли очереди за колбасой :-)

Вот я кстати сегодня протестировал игру в мафию 8 ботов друг с другом. Так вот , казалось бы незначительные мелочи вроде стартовой позиции довольно сильно влияют на поведение.

Sign up to leave a comment.

Articles