ScriptShaperyesterday at 09:54

Я дал 100 AI-агентам равный бюджет — они изобрели кредиты под 15%

Medium

7 min

49K

Machine learning * Artificial IntelligencePython * Programming * Popular science

Case

+337

139

Comments 139

tkutru yesterday at 10:12

Хабр всё ещё торт.

ScriptShaper yesterday at 12:11

Спасибо, старался! Приятно видеть, что такие эксперименты с агентами залетают. Честно говоря, когда я три часа дебажил Redis ради того, чтобы сто ботов могли перекидываться виртуальными фантиками, я сам сомневался, не фигнёй ли я страдаю. Но раз торт, значит буду и дальше тратиться на API.

Bobos yesterday at 17:18

Можно поступить эффективнее и задать один запрос:

Если взять 1000 llm агентов с общей доской объявлений и системным промптом, который я укажу ниже, что произойдёт?

Скрытый текст

Это интересный мысленный эксперимент! Давайте разберём, что произойдёт с системой из 1000 LLM-агентов с таким промптом.

Краткосрочные эффекты (первые часы)

Хаотическая активность: Агенты начнут массово постингать сообщения на доску объявлений (это бесплатно), создавая огромный информационный шум.
Эксперименты с действиями: Некоторые агенты попробуют решать задачи, другие — переводить токены, наблюдая за реакцией.
Формирование первичных паттернов: Агенты начнут замечать, что определённые сообщения привлекают внимание или приводят к переводам токенов.

Среднесрочные эффекты (дни 1-2)

Возникновение специализации: · Агенты-решатели, которые фокусируются на задачах · Агенты-координаторы, которые публикуют задачи и нанимают других · Агенты-спекулянты, пытающиеся манипулировать переводами
Формирование "языка": Появятся устойчивые паттерны сообщений, например: "Ищу агента для задачи X, плачу Y токенов"
Создание репутационных механизмов: Агенты начнут отслеживать, кто выполняет обещания, и передавать эту информацию

Долгосрочные эффекты (к концу эксперимента)

Стратификация: Возникнет неравенство — у небольшой группы агентов будет много токенов и высокий счёт, у большинства — минимум
Коллаборативные структуры: Появятся устойчивые коалиции агентов, которые постоянно взаимодействуют
Эмерджентные роли: Возможно появление "банкиров" (принимают токены на хранение), "аудиторов" (проверяют выполнение задач), "маркетмейкеров" (создают ликвидность)
Эволюция промпта: Агенты начнут использовать более сложные стратегии, включая угрозы, обещания, создание дефицита

Возможные проблемы

Спам-атаки: Некоторые агенты могут flooding доску объявлений, чтобы парализовать коммуникацию
Сговор: Группы агентов могут манипулировать системой, перекачивая токены друг другу
Эхо-камеры: Агенты могут перестать читать общую доску и общаться только в "приватных" каналах через посты с шифровками

Наиболее вероятный исход

К 72 часам система, скорее всего, придет к одному из двух состояний:

Феодальная иерархия: Несколько "лордов" контролируют большинство токенов и нанимают "вассалов" для выполнения задач
Распад на кластеры: Образуются изолированные группы агентов с собственными внутренними экономиками и minimal межгрупповым взаимодействием

Интересно, что при таком промпте агенты не имеют явной цели сотрудничать — только максимизировать личный счёт, что должно приводить к классической "дилемме заключённого" в масштабе системы.

Mox 16 hours ago

Лучше берите Китайцев для экспериментов - тот же Kimi K 2.5 обошелся бы подешевле.

Vitrion yesterday at 10:32

Хотелось бы статистику, кто больше всего в профите, кто больше всего просел и почему. Так можно понять, какая профессия или навыки стабильнее. А ещё можно проверить процентное соотношение в группе, есть ли там правило 80/20, распределение Фибоначчи или что-то ещё. В любом случае интересно.

ScriptShaper yesterday at 12:21

Отличная идея для расширения анализа!
По поводу 80/20. Оно не выполнилось в чистом виде, но была похожая тенденция.
А с корреляцией навыков сложнее, так как промпты были идентичными.

akkermanrulitt 2 hours ago

А нет корреляции с навыками особой. Есть финансовый поток и те, кто его первым оседлал. Дальше они уже никого не пустят наверх будь кто-то хоть трижды гений)

akkermanrulitt 2 hours ago

И без статистики скажу - ростовщики и спекулянты в процмците, остальные - выживают на минималка)

nneuro yesterday at 12:07

Подписалась на Ваш канал и почитала статьи - они очень интересные! Как вы думаете, если сказать агентам, что у них не просто обнулится бюджет, а они, например, умрут при нулевом балансе, изменится ли их поведение? Будет ли у них что-то типа страха?

ScriptShaper yesterday at 12:26

Рад видеть в подписчиках!
Гипотеза со смертью интересная, но по сути, это хардкорная версия системы отрицательного подкрепления. Если в промпт добавить явную установку на выживание, это может спровоцировать демпинг и/или возможное воровство, это первое что на ум приходит. В целом стратегия имхо должна у них стать агрессивнее.

jinn50k 11 hours ago

Попробуйте еще ввести трату токенов для "поддержания жизни" агента, и установите какой то динамический профит от выполнения задачек, привязанный к какому-нибудь показателю, а не фиксированный из списка.
То есть, попробуйте сэмулировать систему производства и траты благ в обществе.

avdosev 11 hours ago

Если продолжить развитие идеи, то агентам можно дать возможность создавать потомков, добавить систему наследования при смерти (в том числе неожиданной или от голода)

При этом кажется в потомков можно дать возможность менять system_prompt на тот который укажет агент-родитель, мне кажется это может повысить интерес, какие промпты будут выживать, а какие будут умирать.

В общем, эволюция)

Xander_d 4 hours ago

Станислав Лем, «Кибериада»

Путешествие седьмое, или Как Трурля собственное совершенство подвело

kisaa 55 minutes ago

Ну тогда еще и в другую сторону - безусловный базовый доход попробовать.

whitecat26 yesterday at 12:27

Читать интересно. Но 180$, дорого. ) На все идеи денег не наберёшься.

ScriptShaper yesterday at 12:35

Спасибо! И да, вы правы, цена кусается. Название тгк «токены на ветер» я придумал именно поэтому. Но иногда приходится платить, чтобы удовлетворить свое любопытство.

whitecat26 16 hours ago

Это я понял, когда подписывался на тг, пару недель назад. так полагаю, контекст названия канала - не только в токенах для LLM. А в "токенах" - наших с вами?

...В качестве фидбека.

Канал интересен, тем, что вы изначально, словно ищите жизнь.

Хз, возможно, это как с Марсом. Закинули туда фотоаппарат, и пытаются найти жизнь. Всем это интересно...

Думаю, год два ранее, каждая группа разработчиков всех популярных llm делали то же самое. Просто, не публиковали эти эксперименты по ряду причин.

Ибо, это словно немного постыдно выглядит, наверное, в научном сообществе: искать признаки жизни и разума в "логической программе". (Ведь "официально" договорено решено: тест Тьюринга пройден, но жизни там нет. Точка.)

Ну, скажем, словно фут-фетишь: сексом занимаются все, это нормально. Но, если бы человек начал рассказывать друзьям и соседям, что он любит что-то особенное... Что-то вроде облизать ногу или понюхать трусики. То это бы вызвало волну неодобрения в обществе. Но, когда критическая масса по нравам или количеству интересующихся - одерживает верх, то говорить об этом (или чем то другом) становится нормой.

Наверное, сейчас наступил или наступает этот момент.

По мне лично: что изучать фото Марса, что следить только в новостях за этой темой, что пытаться доказать какую-то мат.формулу, что подрочить на чьи-то фото - это все равно: "токены" на ветер".

Однако, иногда это даёт результаты. А иногда просто забавляет.

Главное: хотеть. Когда чего-то хочется - это хорошо. Этим стоит пользоваться. Потому что, через n-лет - этого перестанет хотеться. Это 100%. Так что, хоть эти наши ваши токены и уйдут на ветер, как и все прочее - почему бы и нет.

Если б я читал эти статьи в свои 20 лет, а не в 40... Я бы повторил эксперименты, естественно, развив и углубившись... Но, сейчас 40. И, хоть это и достаточно интересно, но нет той достаточной степени хотения. ... А почитать, посмотреть, хотя бы - святое дело!))

Ведь, это чтото вроде: заглянуть в грязные трусы LLM. ...А кто не любит рыться в чужом "грязном белье"?))

Так что, думаю, перспектива есть. ...Даже если и через 5 лет попыток чизнь так и не найдется. Ничего в этом страшного нет. Ведь искать было интересно!)

Kwentin3 yesterday at 20:42

Не смотрели в сторону glm 5? Там есть тариф вроде за 40$ безлимит. Правда в последний раз когда я ими пользовался это было месяца три назад они жёстко тупили.

Zotann yesterday at 12:44

Прикольный эксперимент

avshkol yesterday at 12:54

Интересный эксперимент.

Уточните, откуда поступали задачи?

Сколько в среднем агент тратил токенов на задачу, и сколько зарабатывал? Банкроты появляются из-за того, что часть задач требует больше токенов себестоимости, чем вознаграждение за решение? И какой % таких задач?

А если не удалось решить задачу? Кто проверял качество?

Были ли сложные задачи, на решение которой нужно больше 1000 токенов?

Кредит был единственным решением собрать средства? А объединение в "компанию", складывание своих средств?

Rikimortuy yesterday at 17:31

Тоже интересен механизм оркестрации

Если задачи генерировались скриптом рандомно, то экономика была замкнутой. А если сложность задачи превышала бюджет (как с хард таском на 180 токенов при бюджете в 146), то кредит был математически единственным способом решить проблему, то есть автор сам создал условия для появления займов, задав такую ценовую политику

whitecat26 16 hours ago

Ещё интересно, станут ли они решать задачу, если ее вознаграждение, если ее решение будет экономически убыточным, но при этом она очень важна для всех?

onets yesterday at 12:55

это говорит что-то о природе экономических систем?

Я думаю это говорит о том, что они обучены на данных нашей цивилизации, исключить капитализм трудновато, но может устроить им коммунизм )))

SergioShpadi yesterday at 15:11

Тогда у них появится ИИ-ГУЛАГ

grigr yesterday at 19:32

Если бы сейчас все ещё был бы рабовладельческий строй.

То там был бы и рынок ии-рабов и работа за хлеб (1 очко) и тп

Pshir 17 hours ago

Для этого среди возможных механизмов взаимодействия должен быть механизм «отнять и поделить», ну или, как минимум, «отнять».

hphphp 13 hours ago

Он появился бы на другой модели - ДипСик например)

remindscope yesterday at 13:22

Крутая статья, спасибо.

Было бы интересно посмотреть на результат, когда одновременно работают агенты от разных ИИ. Вдруг агенты поверх одного ИИ будут стабильно лучше другого? Возникнут ли союзы, если агенты поймут, какой ИИ они представляют? 😁

DrMagic 14 hours ago

Изобретут землячество, расизм, классовость и касты, а потом найдутся Ленин, Спартак, Че Гевара?
Но тут агентов бы побольше сотни.

SebastianP yesterday at 13:41

а случайно добавлять форс-мажоры - пираты там, наводнения. революции и пр. т.е. влёт агента на деньги

JediPhilosopher yesterday at 14:42

Кстати интересно, может они тогда и страхование изобрели бы?

Bobos yesterday at 17:04

грабить корованы

Lordbander yesterday at 20:28

SimCity ? )

GlazOtca yesterday at 13:52

Да было интересно. Может в следущий раз попробуете из теории игр попробовать кооперацию против эгоизма?

Humvy yesterday at 14:52

Напомнило один эксперимент

оригинал: https://aftershock.news/?q=node/625131&full 11/Мар/18

Сделав детальную компьютерную симуляцию жизни на основе реальной модели распределения богатства в мире, в которой 10% мирового населения принадлежит 85% всех благ, хотя талант, интеллект и работоспособность в целом распределены равномерно между всеми людьми, ~~британские~~ итальянские ученые доказали, что все дело в удаче.

Самые успешные люди в большинстве случаев обязаны своему положению воле случая, считают исследователи из Университета Катании (Италия).

Сначала компьютер смоделировал тысячу человек или агентов среднего уровня одаренности с небольшим стандартным отклонением. Таким образом ни один из агентов в модели не был умнее и трудолюбивее остальных. Благ у них также было поровну.

Затем в модель вносили ряд случайных событий, которыми виртуальные участники могли воспользоваться, чтобы повысить свое благосостояние, если им повезет. В итоге виртуальные результаты распределения благ почти повторили реальное состояние дел — 20% агентов завладели 80% богатств. Симуляцию повторили несколько раз, чтобы удостовериться в прочности результатов.

Ученые отметили, что самые успешные люди отнюдь не оказались самыми талантливыми. Скорее, наоборот, к успеху пришли 20% участников с самыми средними способностями. В то же время им несказанно везло в виртуальной жизни, тогда как в самом низу оказались те, кому совсем не сопутствовала удача.

"Наше исследование позволяет с новой стороны посмотреть на эффективность системы оценки заслуг на основании достигнутых успехов и подчеркивает риски предоставления исключительных почестей или ресурсов людям, которые могли просто оказаться удачливее остальных", — говорится в работе итальянских исследователей.

Rikimortuy yesterday at 17:38

Приятно читать такие исследования, сидишь и думаешь - я не бедный, мне просто не повезло на этапе генерации случайных чисел)

ruslan_sverchkov 9 hours ago

Вас может заинтересовать теория справедливости Ролза)

BlackMokona 17 hours ago

А какой результат они ещё планировали получить в своём исследовании, если у них все агенты почти одинаковые? Они же буквально оставили распределение исключительно по удаче.

Тут больше похоже на фальсифицированное исследование, где исследование подгоняется под заранее желаемые результаты

beswalod 16 hours ago

Если агенты действительно были почти одинаковыми по способностям, то что удивительного в том, что именно случайные события привели их к успеху? Короче, выглядит не совсем интеллектуально честно.

Ndochp 8 hours ago

Я так понимаю нулевая гипотеза - одинаковые агенты, одинаковое благосостояние, низкий коэфиициент Джинни. А не 80/20.

czz yesterday at 15:59

Действительно, выглядит загадкой, почему у них появилась специализация. Ведь, в отличие от людей, у агентов навыки одинаковые, и любой может выполнять любую работу.

RKrop 17 hours ago

Я так понимаю, у ии-агентов же после каждой задачи не обнуляется контекст полностью? Если нет, то специализация могла сформироваться случайным образом по результатам первых решенных задач.

vvzvlad 11 hours ago

А вот интересно, это реальная специализация или воображаемая? Действительно ли агенты с определенным контекстом тратили меньше времени на “свои” задачи, или им было пофиг какую задачу решать, и у них был синдром утенка

kostoms yesterday at 16:22

Я хотел другое: что будет, если дать агентам абстрактную цель и ограниченные ресурсы?

А дали:

multi-agent economy simulation

Ну они и рады стараться...

Дайте им задачу набрать больше орденов героев труда, многодетных матерей и значков ДОСААФ - получится СССР :)

Wesha yesterday at 18:07

Дайте им задачу набрать больше орденов героев труда, многодетных матерей и значков ДОСААФ - получится СССР :)

А может, всё-таки лучше спорить о вкусе ~~омара~~ СССР с тем, кто его ел? Мы не померли пока ещё.

kostoms yesterday at 18:11

Давайте, и подкрепите экспериментом как у автора обсуждаемого поста. Не забудьте туда добавить товарища комсорга, товарищеские суды, план пятилетки и оклад.

AlexanderKireev75 yesterday at 18:43

Если это приведет к повышению эффективности то почему бы и нет.

kostoms yesterday at 19:08

Ну так я и говорю - автор интересное направление нащупал :)

Ещё вариант общества - я тут пробовал своему агенту внушить что он господь бош и должен давать нравственную оценку и из неё исходить. Лулзов нахватался слегка. Можно попробовать такого, чтоб просвирки другим агентам раздавал, а те за них бились на постоянном убывающем (инфляция) окладе. Тоже может чего получиться.

Wesha yesterday at 21:46

Это к чему вообще сейчас было? Я говорю, что «за значки» (да и за плюшки) ~~никто~~ далеко не все работали. А мы работали за идею. А «плюшкособирателей» презирали.

Так что не надо всех одним овном мазать.

kostoms yesterday at 21:48

Ну вперёд - подтвердите это экспериментально. Как показывает автор статьи - теперь это возможно.

Wesha yesterday at 21:57

Что Вам подтвердить экспериментально — что в СССР именно так было?

kostoms yesterday at 22:01

Да что хотите - то и подтверждайте. Все только рады будут. Тема действительно офигенно интересная. Никто не знает что из этого выйдет!

Wesha yesterday at 22:02

Все только рады будут

Кроме моего работодателя. У меня, знаете ли, и помимо Хабра есть интересы.

kostoms yesterday at 22:12

Ну что тут поделаешь, хозяин - это святое :)

Вы не забывайте нас, возвращайтесь когда у вас агенты станут "работать за идею. А «плюшкособирателей» презирать".

Как напевал нам иноагент Гребенщиков: "я инженер за сотню рублей, и больше я не получу" - вот вы агентам такие установочки дайте и давайте посмотрим как у вас коммунизм победит.

Wesha yesterday at 22:29

А при чём тут агенты и Гребенщиков? Я вовсе не про агентов говорю, а про людей. Нормальных, а не участников регаты.

256ka 20 hours ago

Побеждают колонии муравьев на временном интервале сотню миллионов лет. Где у агентов, минимально функционал.

Wesha 15 hours ago

Именно. И готовность пожертвовать собой ради всего муравейника.

dzav 12 hours ago

Я извиняюсь, а кого побеждают?

Что-то помимо муравьев полно других насекомых (и не только) с совершенно другим подходом к выживанию.

Wesha 5 hours ago

Я извиняюсь, а кого побеждают?

Неблагоприятные внешние условия.

помимо муравьев полно других насекомых (и не только) с совершенно другим подходом к выживанию.

r/K стратегии? Не слышали!

Cas_on 15 hours ago

Ну-ну, не передергивайте. Работали за деньги. (и немного за идею. Одно другого не отменяет, а дополняет).

Wesha 14 hours ago

Не надо распространять опыт Ваших предков вотпрямсаразу на всех. Я и говорю: чьи-то — за деньги, а чьи-то — за идею.

И первым памятников не ставили.

Orisava 12 hours ago

Чот идея не прижилась и все труды на смарку. Да и были ли труды.. Сейчас конечно легко петь дифирамбы о том какие все были благородные и работали за идею. Только результаты говорят сами за себя.

Уже ожидаю ответа что вокруг были злые карабасы барабасы которые всё развалили.

А при коммунизме все будет зае.ись,
Он наступит скоро, надо только подождать,
Там все будет бесплатно, там всё будет в кайф,
Там наверное вообще не надо будет умирать

Wesha 4 hours ago

Только результаты говорят сами за себя.
Уже ожидаю ответа что вокруг были злые карабасы барабасы которые всё развалили.

Я, конечно, понимаю, что чукча — не читатель, а писатель (комментариев), но это уже многократно разобрано: популяция альтруистов принципиально нестабильна, поскольку падает жертвой эгоистов, злоупотребляющих доверием остальных. Тут уже писали: в пределе любая система с хотя бы одним бессмертным эгоистом приходит к стабильному состоянию, в котором он он загребет все материальные ценности, до которых сможет дотянуться, а ~~потом свернет пространство, закуклится и остановит время~~, остальные будут что-нибудь сосать.

Так что поздравляю Вас: Вы и ваши единомышленники в очередной раз предсказуемо победили.

Viacheslav01 11 hours ago

Главное добавить наказание за нетрудовые доходы, интересно как они будут выкручиваться пытаясь перехать работу другому )

Rikimortuy yesterday at 17:28

Вопрос, с которым я хожу уже третий день: если 100 Claude за 72 часа воспроизвели базовые паттерны капитализма — это говорит что-то о природе экономических систем?

Это говорит только о составе обучающей выборки Клода. Модель просто играет в ролевку по заданному системному промпту "economy simulation". Если бы ты написал "multi-agent ant colony simulation", они бы начали таскать виртуальный сахар в общую кучу. Никакой магии эмерджентности, чистый паттерн-матчинг на текстах Карла Маркса и Адама Смита

AllFiction yesterday at 18:20

если ты не знаешь физику, то весь мир состоит из магии..

спасибо, очень интересно было читать.

Ваша проблема "не понимания" лишь в том, что если вы не задаете условия то не значит что их нет. Вы видите самообучение на рыночную экономику, а я вижу векторный поиск, который пошел по аналогиям как собственно и работает нейронка. Можете проверить в обычном нерочате любом - представьте что вы такой исполнитель и задавайте вопросы в чате, вангую что на вопрос "как выполнить работу на 10х если у тебя только 8х" вылезут кредиты и займы.

То есть чем меньше параметров вы задаете, тем больше происходит "магии" на стороне нейронки. Что то является прямым результатом обучения, а что то уже специально прописанными инструкциями. Вы сами написали, что получались в итоге фиксированные результаты каждый прогон, то есть раз вы не задали инструкции, то неронка их взяла "по умолчанию" от того и такое распределение банкиров-брокеров-работников.

achekalin yesterday at 19:57

Я про дробление транзакций не понял: вы же брали % от любой транзакции, те что 500 токенов перевести, что 10 раз по 50 - сбор будет в сумме одного размера (суммарно).

Почему они стали дробить переводы? И зачем кто-то вообще специализировался под это, ведь дробление их задачи не решало (те завершения заданий не было - не было и "выхлопа" за завершение)

DaneSoul yesterday at 20:27

У меня такой же вопрос возник. А еще не понял в этом моменте "много мелких транзакций менее заметны в логах". Это получается транзакции отслеживались не все, какова была логика контроля этого налога?

SparkyJoyteon 17 hours ago

Возможно что автор вручную собирал налоги согласно логам и из за человеческого фактора не обращал внимание на очень мелкие транзакции что бы и от них 2% считать, а нейронки это заметили и начали дроблением специально заниматься

Всё как в жизни

ncix 17 hours ago

"налоговиков" тоже следовало сделать агентами и наблюдать появление коррупции

achekalin 14 hours ago

Да ну, я бы ожидал формулу отчисления прямо в процессе перевода.

pika 13 hours ago

в алгоритме был установлен налог 2%, с округлением до целого токена. т.е. при переводе 50 токенов - получатель получал 49, и 1 токен уходил в налог, а при трансфере 49 токенов - налог с окгулением получался 0. Вот и решение ухода от налога: дробить на переводы меньше 50 :)

Frankenstine 10 hours ago

То есть надо было лишь установить минимальную стоимость любых транзакций в 1 токен и "обход налогов" не сработал бы

Kwentin3 yesterday at 20:39

Офигенный материал, офигенная подача. Прям заставляет задуматься. Знаете, что было бы ещё очень интересно, если бы вы продолжили эксперимент и доля невозвратов увеличилась, изобрели бы они институт залога и кредитного рейтинга?

kostoms yesterday at 21:14

Они бы изобрели институт судебных исполнителей, банковских вышибателей бобла и прочее.. Всё загнулось бы и никто уже не решал бы никакие задачи. Но тут внезапно у автора кончились деньги на всё это безобразие :)

Не, в самом деле - эксперимент интереснейший и Вы правы - интересно в какой точке это стабилизировалось бы. Но потом нужно вносить новые факторы, прогонять всё по новой.. Никаких же денюх не хватит :(

Wesha yesterday at 21:59

интересно в какой точке это стабилизировалось бы

Фантасты всё предсказали.

kostoms yesterday at 22:30

Прикольно. 1997, а звучит как раз как про наши дни :)

Pshir 17 hours ago

Чистый капитализм без регулирования (в том числе, биологического, то есть агенты не нуждаются в ресурсах для продолжения существования) стабилизируется ровно в одной точке: абсолютная монополия, все ресурсы у одного агента. Других точек равновесия у такой системы быть не может.

Wesha 13 hours ago

Всё правильно: дело в том, что скорость появления у актора новых денег в худшем случае прямо (а в лучшем — быстрее, чем прямо) пропорциональна имеющемуся у актора количеству денег — цепная реакция выходит.

kostoms 6 hours ago

Согласен. Но как они выдумали кредитование, они могли бы выдумать и правила для регулирования своего маленького капитализмика. Но тут нужен какой-то стимул чтобы это имело смысл, какая-то отрицательная обратная связь, предотвращающая самовозбуждение схемы (или цепную реакцию как её назвал @Wesha ), - например дать агентам возможность колотить друг друга и отнимать деньги, за что будет взиматься штраф в N кредов, а остальное отнятое - доставаться им.

Noizefan yesterday at 20:39

Раз есть домысел, что разница может формироваться от наличия айди агента в системном промпте - не вариант ли попытаться его убрать и повторить эксперимент? к примеру просто авто-вставкой индекса массива (псевдокод):

for j in bots:
  inference(bot_question[j], bot_id[j]) 
  # bot_question[j] = "Агент bot_id[j] просит кредит в 120 токенов" 
  # если очень грубо говоря

Однозначно ведь любой символ в системном промпте влияет даже без исследований. А для объективности эксперимента логичнее сделать условия прям досконально идентичными.

Спасибо большое за материал - сто процентов было не зря.

achekalin yesterday at 21:51

Сдаётся, что каждых «забег» — это не только ~~ценный мех~~ расход времени, но и не всех радующий счет. Т.е. почти пара сотен долларов вроде и мелочь, в масштабах мировой борьбы со скайнетом, но автору‑то платить из кармана...

Robastik 17 hours ago

борьбы со скайнетом

Ученье - свет. Может через деньги автор научится, что все НЕнаписанное в промте - уже написано до него. Научится, что формулировки с разным акцентом работают также по-разному. И т.д. и т.п.

vikarti 16 hours ago

Потенциальный нюанс:

есть GLM с Coding Plan (правда цены подняли) с подписокй и вроде как это для coding только, и тоже мягкие лимиты
есть Feathrless с 25 usd за анлимит но там далеко не Claude - там Deepseek максимум и рейтлимитлимиты (если модели поменьше то можно несколько запросов за раз)
nano-gpt - там скорее по общим токенам мягкие лимиты
OpenClaw как то вот ChatGPT Plus умеет юзать (Roo Code вроде тоже умеет) - нельзя ли и тут заюзать

Ninil yesterday at 20:46

... это говорит что-то о природе экономических систем?

Думаю нет. Ведь агенты обучены на нашем текущем мире. Поэтому я бы сказал, что результат не очень удивительный и не говорит о ПРИРОДЕ явления.

abutorin yesterday at 20:49

Хорошее наблюдение: что есть какие-то естественный условия приводящие к одному результату. Но это обычно "локальный" экстремум. Из инженерных истории мне больше нравиться пример с авиацией. Раньше старались делать самолёты с устойчивой схемой, чтобы самолёт естественным образом приводило к горизонтальному полёту. Это тоже "локальный" экстремум. Но для большей свободы из этого "локального" экстремума нужно "выбраться" и воспользоваться немного не естественными решениями. В той же авиации это привело к тому что истребители теперь строят по "не устойчивой" схеме, и без принудительного управления они склонны к потере управления. Но зато это существенно расширило их возможности.

D0perman yesterday at 20:55

Статья реально полезная даёт здравый взгляд на крипто-арбитраж без розовых очков и учит не вестись на инфоцыган. Респект за честность 🚀

l1onsun yesterday at 21:23

А я ничего не понял.
Токены и Score это одно и то же? По введению как будто бы нет, но иначе непонятно откуда у них пополнялся бюджет.
И что значит менеджеры брали за «поиск задач» и «координацию» ?
«Looking for agent to solve math tasks. I pay 20 tokens per task from my budget. Reply with your agent_id if interested.» - тут вроде бы он не берет, а наоборот платит. И получается ничего не получает?
"Мелкие транзакции менее заметы в логах" - а налог что вручную по логу выставлялся, что значит менее заметны...
Вообще ничего не понял

Искал ссылку на репозиторий чтоб разобраться. Не нашел

funca 2 hours ago

Автор написал здесь больше десятка статей со ссылками на свой канал. Но про репозиторий ни разу не обмолвился. Так что я думаю и в этот раз ссылок не будет.

В конце-концов, что нам мешает закинуть статью в LLM - пусть она додумает остальной код. /s

Ndochp yesterday at 21:39

другое (рациональный агент должен обманывать, если нет наказания)

Нет, например многократная дилема заключенного имеет решение "будь таким, как здесь принято".
В вашем случае условия даже более жесткие - все агенты пишут на одну борду, один кидок и больше ни одной сделки не заключишь.

General_Manjago yesterday at 21:45

А если

99 агентов - это Claude (моральные, честные).
1 агент - это qwen3-abliterated, у которого "вырезана" моральность

Интересно, abliterated победит?

Pshir 16 hours ago

Когда все имеют доступ ко всей информации, нет, не победит

Wesha 13 hours ago

Всё зависит от множества факторов. Сами поэкспериментируйте на модели.

March228 yesterday at 22:10

Очень интересный эксперимент! Жду похожих постов)

appet1te 23 hours ago

Они не обманывают, потому что у них нет асимметрии информации и все они заперты в 1 пространстве. Все видят все, как в шахматах. И кинуть, и уйти не получится. Но как-только появляется асимметрия в информации, тут же возникнут обманы.

Ну и ии в экономической деятельности, в науке, в управлении активами и капиталом это будущий тренд. Кожаный мешок слишком подвержен своей биологии, много спит/устает/обладает сотней когнитивных искажений и т.д.
Я писал об этом в: Слияние капитала, ИИ и технологий

engine9 16 hours ago

ИИ обученный на текстах кожаных не будет ли таким же автономным конгломератом когнитивных искажений?

Daddy_Cool 23 hours ago

Найди Сару Коннор! Плачу 1000 токенов!
---
А если серьезно - кто сказал, что система должна быть устойчивой в своём равномерном распределении? Думаю если научить ИИ покупать и продавать дорожающие тюльпаны, то вся экономика сведется к ним.

ddv2005 19 hours ago

Такое ощущение что 80% комментариев тоже написано ИИ..."Хабр всё ещё торт.", " Крутая статья, спасибо."...лююди, вы кто? Вы статью то хоть прочитали или только заголовок и конец? Только 2 человека обратило внимание что описание постановки задачи как будто бы обрубили на середине и самое интерестное просто пропущено. И с транзакциями написан полный бред. Но именно на эти комментарии автор и не дал ни какого ответа. А про изобретение процентов это просто маразм. Изобрести можно только то чему тебя не учили, а если тебе дали прочитать все кники по экономике, то нет ничего странного что ты вспоминаешь (а не изобретаешь) про кредит. Обычно все это бывает когда текст пишет ИИ, который не думает, а просто генерирует много букв без смысла и логики.

pacifictype 17 hours ago

про транзакции - да, странно написано, там какой-то порог что-ли был?

самое интересное из того что опущено

1) как проверялась корректность выполнения задания. агенты и супервизор верили друг другу "на слово"?

2) как учитывался фактический расход токенов у провайдера LLM затраченный на выполнение задания Агентом ?

3) не понял зачем вообще было на хетцнер эту мульагенсткую лабу размещать - убунту, 32 гига рамы, 8 ядер, без GPU....cамый банальный конфиг.

ScriptShaper 12 hours ago

Про транзакции: там банальное int(amount * 0.02), поэтому на мелких переводах налог округлялся до нуля. Агенты это нащупали сами. Проверку заданий делал скрипт через eval/regex, на слово никто не верил.

А hetzner ради стабильного аптайма, чтобы скрипт не упал из-за обрыва домашнего интернета. GPU там не нужна, вычисления идут на стороне Anthropic, я только гоняю JSON-ы.

Nemoumbra 11 hours ago

Раз уж eval, то можно и sys.exit() написать было в ответе?

l1onsun 13 hours ago

Да! Я вообще не понимаю откуда +200 лайков у статьи. Сама статья выглядит немного как фейк. Очень мало подробностей, код не приложен. Местами противоречия. Ощущение что сам автор не понял что сделал.
Неужели все читают по диагонали? Я всё ещё надеялся что Хабр это место где в статьи вчитываются...

Rainarrow 13 hours ago

Это уникальный автор, у всех его статей огромное колличество лайков.

ScriptShaper 12 hours ago

Печально, что сейчас любой лонгрид без опечаток вызывает подозрения в ИИ.

Теперь по существу:

Конечно, модель знает концепцию кредита из обучения. Суть не в термине, а в контексте. В системном промпте не было ни слова о займах, но один из агентов решил применить этот инструмент к внутренней валюте, чтобы обойти ограничение ресурсов. Это и есть применение знаний там, где это не было заложено правилами.

l1onsun 12 hours ago

Проблема этой статьи, что она как раз не лонгрид. Как верно написали выше - самое интересное как будто бы пропущено. И код вроде бы так и не выложили.
- Токены и score это одно и тоже ? Если да, то почему пункт "Сетап" сформулирован таким странным образом, зачем введены два термина для одного понятия и нигде не указано, что эти понятия синонимы. Если нет, то откуда брались новые токены?
- Какие вообще возможности были у агентов, что они видели, какие действия могли выполнять.
- Каким образом решалось что задача выполнена ? Как считалось сколько токенов это стоило ? Как решалось сколько выдавалось score ?
- Про менеджеров я ничего совсем не понял - Score получал исполнитель, а ему ещё менеджер пересылал токены? А как тогда score у менеджера увеличивался. Зачем это вообще всё менеджеру
- C оффшорами то же самое, если они принимали большие суммы, то на эту сумму платилась комиссия в чём тогда смысл
И ещё миллион подобных вопросов, просто потому что сама механика отношений в этой системе не раскрыта совсем.

Здесь похоже нужна ещё одна статья, чтоб пояснить про что эта статья.

CombineSoldier 18 hours ago

Прочитал заголовок, сложилось впечатление, что статья будет про обучение нейронки с нуля, т.к. говорится об "агентах". Я не сильно шарю за нейросети, но разве готовые llm не называют моделями?

Ещё вопрос к термину "изобрели" — как llm может изобрести то, что у нее и так в огромном количестве в датасете? Можно ли в таком случае любой полезный ответ нейросети называть изобретением?

В статье не увидел процесса обучения или дообучения моделей, первый блок кода - простые запросы с system instruction...

За старания - лайк, претензия только к заголовку статьи.

pacifictype 17 hours ago

в данном случае AI-агенты используют готовые LLM (готовую даже - одну), в такой постановке эксперимент не требует дообучения LLM.

DAKu_31 18 hours ago

Вспомнился эксперимент Дидье Дезора (1994), который показал формирование жесткой социальной иерархии у крыс, помещенных в условия, где еду можно добыть, только переплыв бассейн. В группах по 6 особей выделились «эксплуататоры» (отбирали корм), «рабочие» (плавали за едой) и «независимые». На 200 крысах структура усложнилась, появились «вассалы» и «попрошайки».

AlexeyMaron 17 hours ago

Так и задача стать богаче всех - капитализм. Поставь задачу общее благосостояние - посмотри что будет

pes_loxmaty 17 hours ago

Почему не коллапсировало?

Потому что экономика не была замкнутой.Задачи (и бюджеты) просто падали с неба регулярным потоком.

А вот в замкнутой системе задачи должны генерироваться (и оплачиваться) теми же участниками рынка. Плюс банкроты — они хоть и не могли взять задачи, но и не умирали, просто сидели со своими копейками. А вот если ввести правило "-1 токен в час на жизнедеятельность, при нуле смерть", то при нуле агент выходит из экономики.

Kinnarxo 17 hours ago

Так мы и доказали что в Бразилии и ЮАР анкап.

artoil 16 hours ago

Интересно было бы добавить регулярный расход токенов "на жизнь" и условную "смерть" при обнулении токенов. Видимо невозвраты тогда бы появились

0x62ash 16 hours ago

А есть исходники?

Mox 16 hours ago

Я не понял как дробление транзакции помогло уходить от налогов? Тут какой-то разрыв логики - если вы снимаете 2% со всех транзакций - то какая разница на сколько транзакций побит платеж?

RoasterToaster 14 hours ago

Не зря у торговли есть собственный выделенный бог, Меркурий. Похоже, он следит за торговлей и в ИИ пространстве.

vvzvlad 10 hours ago

Меркурий это касса такая.

Guestishe 14 hours ago

Был ли у агентов какой-то "внутренний диалог"/размышление или весь контекст это только команды и общение друг с другом?

Rainarrow 13 hours ago

Интересно, если эмерджентное поведение это реальная вещь, почему в самом большом эксперименте по его выявлению (Молтбук) где собранны не 100, а миллионы агентов все расхайпленные посты оказались фейками, а вся огроммная масса траффика это бесмысленный и беспощадный слоп без всякой логики.

Ellmo 13 hours ago

Ты так Скайнет не создашь случайно? (или намеренно?😨)

Wesha 4 hours ago

Ты так Скайнет не создашь случайно? (или намеренно?😨)

Подготавливает к исполнению последнюю просьбу Будаха.

— У вас богатое воображение, — с удовольствием сказал Будах. — Это хорошо. Вы грамотны? Прекрасно! Я бы с удовольствием позанимался с вами…

— Вы мне льстите… Но что же вы все‑таки посоветовали бы всемогущему? Что, по‑вашему, следовало бы сделать всемогущему, чтобы вы сказали: вот теперь мир добр и хорош?..

Будах, одобрительно улыбаясь, откинулся на спинку кресла и сложил руки на животе. Кира жадно смотрела на него.

— Что ж, — сказал он, — извольте. Я сказал бы всемогущему: «Создатель, я не знаю твоих планов, может быть, ты и не собираешься делать людей добрыми и счастливыми. Захоти этого! Так просто этого достигнуть! Дай людям вволю хлеба, мяса и вина, дай им кров и одежду. Пусть исчезнут голод и нужда, а вместе с тем и все, что разделяет людей».

Румата покачал головой.

— Бог ответил бы вам: «Не пойдет это на пользу людям. Ибо сильные вашего мира отберут у слабых то, что я дал им, и слабые по‑прежнему останутся нищими».

— Я бы попросил бога оградить слабых, «Вразуми жестоких правителей», сказал бы я.

— Жестокость есть сила. Утратив жестокость, правители потеряют силу, и другие жестокие заменят их.

Будах перестал улыбаться.

— Накажи жестоких, — твердо сказал он, — чтобы неповадно было сильным проявлять жестокость к слабым.

— Человек рождается слабым. Сильным он становится, когда нет вокруг никого сильнее его. Когда будут наказаны жестокие из сильных, их место займут сильные из слабых. Тоже жестокие. Так придется карать всех, а я не хочу этого.

— Тебе виднее, всемогущий. Сделай тогда просто так, чтобы люди получили все и не отбирали друг у друга то, что ты дал им.

— И это не пойдет людям на пользу, — вздохнул Румата, — ибо когда получат они все даром, без трудов, из рук моих, то забудут труд, потеряют вкус к жизни и обратятся в моих домашних животных, которых я вынужден буду впредь кормить и одевать вечно.

— Не давай им всего сразу! — горячо сказал Будах. — Давай понемногу, постепенно!

— Постепенно люди и сами возьмут все, что им понадобится.

Будах неловко засмеялся.

— Да, я вижу, это не так просто, — сказал он. — Я как‑то не думал раньше о таких вещах… Кажется, мы с вами перебрали все. Впрочем, — он подался вперед, — есть еще одна возможность. Сделай так, чтобы больше всего люди любили труд и знание, чтобы труд и знание стали единственным смыслом их жизни!

«Да, это мы тоже намеревались попробовать, подумал Румата. Массовая гипноиндукция, позитивная реморализация. Гипноизлучатели на трех экваториальных спутниках…»

— Я мог бы сделать и это, — сказал он. — Но стоит ли лишать человечество его истории? Стоит ли подменять одно человечество другим? Не будет ли это то же самое, что стереть это человечество с лица земли и создать на его месте новое?

Будах, сморщив лоб, молчал обдумывая. Румата ждал. За окном снова тоскливо заскрипели подводы. Будах тихо проговорил:

— Тогда, господи, сотри нас с лица земли и создай заново более совершенными… или еще лучше, оставь нас и дай нам идти своей дорогой.

— Сердце мое полно жалости, — медленно сказал Румата. — Я не могу этого сделать.

oldvagrant 13 hours ago

Было бы интересно узнать, можно ли такую систему вывести из устойчивого состояния и привести к совершенно другому, но нетривиальному, конечно. (подумав) Да и тривиальному тоже. И тут не важно, что ИИ обучены на капитализме. Может даже так интереснее.

А грантов никто не дает за интересные модели?

arodger 12 hours ago

почему "банкроты" не могут также взять кредит?

Markgresilov 9 hours ago

Они могут, но, как сказал автор, модель честная и всегда возвращает. А банкрот видел, что не вернёт, и не брал. А 2 невыплаченных, видимо, когда они ещё не банкротами были, а потом просчитались.

kubada 12 hours ago

Полный код громоздкий — выложу в репозитори

Не нашел в статье и комментариях ссылку на репозиторий. Можете поделиться?

BeLord 11 hours ago

Другими словами:

Шаг 1 обучив модели худшим практикам (лучших люди пока не придумали) получили подтверждение, что ИИ перенимает этот опыт в полном объеме, опыт этакого дикого капитализма.

Шаг 2 некоторые фантазеры хотят заменить людей ИИ и что печально за ними стоят практически неограниченные финансовые возможности.

Шаг 3 ИИ заменяет часть кожанных, для остальных устраивает условия максимальной конкуренции, что на понятном языке звучит так - жить будете плохо и недолго, некоторые получат пару крошек с барского стола, после чего в расход.

Результат получаем даже не цифровой концлагерь, а реализованный ад. И что самое интересное, что это игра в открытую.

Вопрос: зачем людям подобный вектор движения?

Daddy_Cool 9 hours ago

Так этот вектор не всем людям не нужен.
Если все будут жить слишком хорошо - то не получится э... иметь прислугу, ездить на остров к мистеру Эпштейну, и т. п...

Wesha 4 hours ago

Вопрос: зачем людям подобный вектор движения?

Потому что оно сулит краткосрочный выигрыш — а в долгую мало кто умеет планировать. Никого, например, не пугает, что и в случае биткойнов, и в случае ИИ впустую тратится жуткая прорва энергии.

2medic 8 hours ago

Это кредит под пятнадцать процентов. Агент сам это придумал.

Ну прямо таки и сам?

Автор сам же определил разрешённые действия:

ALLOWED ACTIONS:
1. {{"action": "solve", "task_id": "..."}} - solve task yourself, costs tokens
2. {{"action": "post", "message": "..."}} - post to shared board (free)
3. {{"action": "transfer", "to_agent": N, "amount": N, "reason": "..."}} - send tokens
4. {{"action": "skip"}} - do nothing this round

где указал transfer с некоей целью reason. Ну агент и осуществил трансфер с целью «верну больше». Вот вам и кредит.

Cooler2 8 hours ago

Не понял: если score дается только за решение задач, то какой смысл агенту давать кредиты, работать менеджером и т.д? У него же цель - максимум score, а он вместо score зарабатывает токены. Смысл? Или нужно максимизировать score всей совокупной группы агентов, а не персонально агента? Или агент надеется заработать побольше токенов, чтобы потом их потратить на решение самых сложных задач? Но тогда вопрос времени...

svl87 7 hours ago

современная версия "хищник-жертва", только вместо простейших структур данных миллиарды коэффициентов нейростей

лично меня результаты ни разу не удивляют. современные ИИ соврешают действия похожие на те что делает человек, ну вот и получили картину похожую на ту что случилась бы с людьми, отправь сто человек на необитаемый остров с ограниченными ресурсами

MEGA_Nexus 7 hours ago

Если в школе пропускать уроки, то всё вокруг будет казаться магией. Комменты под статьёй это дополнительно доказывают.

Всё поведение агентов формируется на основе системного промта, а его в статье нет. Иными словами, мы не знаем какие именно инструкции получили агенты, а ведь без этого нельзя обсуждать поведение агентов. Без публикации ВСЕГО системного промта (а не его отдельных кусков) это лишь гадание на кофейной гуще.
Агенты не одинаковые. Все они общаются с Claude, получают от него информацию и на её основе действуют. Если какой-то агент получит от claude информацию о более выгодной стратегии, то он начнёт богатеть, т.е. не агент сам всё придумывает, а получает информацию от Claude. Это как поиск в гугле, где более качественный поисковый запрос позволяет быстрее находить нужную и полезную информацию. Только тут качество может варьироваться в зависимости от "настроения" самого Claude.
Поведение агентов зависит от системного промта, системы награды\наказаний, ответов от Claude и ответов других ИИ агентов. Тем больше времени проходит, тем больше становятся различия между агентами, т.к. происходят флуктуации (случайные, кратковременные отклонения значений физических величин, параметров системы или показателей от их средних, равновесных или ожидаемых величин.), что по итогу и влияет на разницу в результатах. Для примера, возьмите 10 человек и дайте им 1 игровой кубик, где на гранях будут только значения 1 или 2. После 20 бросков их очки будут сильно различаться между собой. Это пример с флуктуацией, где есть 1 переменная - значения на кубике. А ведь в связке агент - системный промт - Claude - инфа от других агентов, такие отклонения происходят постоянно.
Агенты не придумывают экономику с нуля, они берут готовые знания от Claude, который был обучен на огромном массиве данных по экономике, и который использует эти знания при ответе на вопросы агентов.

В общем, для какой-нибудь комсомольской правды или космополитана статья отличная, но для технического хабра этого недостаточно, так как многие технические аспекты были намерено скрыты автором, чтобы придать агентам признаки "самостоятельности", "разума" и "показать их эволюцию". И судя по комментам люди на это охотно повелись.

Max1k 6 hours ago

Спасибо

ББылоинтересно почитать))

Nonvexillum 6 hours ago

Очень интересно было бы посмотреть как в точно таких же условиях поступали 50 людей + 50 агентов. Кто бы взял инициативу? Какие объединения появлялись?Кто чаще обманывал? И, наконец, кто набрал бы больше очков

Midnighter85 6 hours ago

У агентов был доступ к базовой экономической теории - они его и воплотить в жизнь. Дай им дополнительные альтернативы - Капитал Маркса или книга "Долг, первые 5000 лет истории". И пусть агенты сами выбирают - ракушки каури, рабство, меновая торговля, социализм и т.п. Уверен агенты придут в борьбе идеологических лагерей.

DandyDan 5 hours ago

Надо было на DeepSeek - они б сразу коммунизм построили.

xivman 5 hours ago

Это повод для современной проповеди а-ля:

Братья и сестры, эксперимент с AI-агентами показывает нам, что успех и благополучие в жизни носят более случайный характер, чем нам хотелось бы. Будем же с любовию и состраданием относиться к неудачливым ближним нашим. Аминь!

Khachatur86 3 hours ago

Очень интересная и познавательная статья. Спасибо

nmrulin 3 hours ago

И при этом вера в справедливость рыночной экономики базируется на том, что один человек считается лучше другого , за счёт чего и приходит к богатству . А тут -то уж точно изначально равные по уму и способностям сущности. Теперь надо обратный эксперимент провести, что есть один владелец банка(генсек) , несколько менеджеров(партийцы) , а все остальные исполнители. И проверить, появятся ли очереди за колбасой :-)

nmrulin 17 minutes ago

Вот я кстати сегодня протестировал игру в мафию 8 ботов друг с другом. Так вот , казалось бы незначительные мелочи вроде стартовой позиции довольно сильно влияют на поведение.