Подведение итогов онлайн контеста по игре Блотто / Комментарии / Хабр

Vsevo10d 25 фев 2019 в 18:07

Две нейронки решили, что лучшая стратегия — кидать нули на выходе и радоваться ничьей.

Нейросети легко найдут оптимум в задачах типа дилеммы заключенного, а человек алчен и азартен.

Nicknameless 25 фев 2019 в 19:03

Ну тут скорее дело во мне, а не в нейронке
Так как я обучал:
Есть две одинаковых модели, они генерируют матрицы 3х3, считаем скор по ним (кол-во занятых клеток плюс ничья), по нему обновляем их веса. Мне кажется, что ошибка в функции потери у меня

neurocore 26 фев 2019 в 06:49

Нужно добавить «психопата», который случайные матрицы подкидывает. Мы же не в идеальном мире

a3aquB 27 фев 2019 в 19:57

вспоминается история, когда ИИ-боты играли в шутер и пришли к выводу, что выгоднее стоять на месте и не стрелять друг в друга

Luxo 26 фев 2019 в 07:40

Теория игр решает.

Не совсем понятно, что означает «идеальное решение». Обычно используется понятие оптимальной стратегии.
Грубо говоря, оптимальная стратегия существует. Это равновесие Нэша. Для таких игр — всегда)
Игроки присылали так называемые «чистые стратегии». А в чистых стратегиях равновесия Нэша для данной игры само собой нету.
Оно в смешанной стратегии. Это когда стратегия — это набор расстановок солдатиков, каждая из которых играется с определённой вероятностью.
Потому-то вы и получили какие-то «дурацкие» бессмысленные результаты. А не из-за того, что «идеального решения не существует».

Nevvy 26 фев 2019 в 12:29

Хотелось бы заметить, что, строго говоря, исследуемая игра — это даже не «игра Блотто», а «аукцион китайских палочек» (chopstick auction). Разница в том, что в игре Блотто цель игроков — выиграть как можно больше сражений, но нет цели выиграть больше, чем оппонент.

Аукцион китайских палочек в каноничном виде — это когда разыгрываются три китайские палочки, ставки на которые принимаются по отдельности, и каждый игрок желает выиграть две палочки из трёх. В контексте данной статьи есть девять полей, из которых каждый игрок желает выиграть на пяти. В отличие от игры Блотто, выигрыш на четырёх полях это не лучше для игрока, чем проигрыш на всех, и выигрыш на всех это не лучше, чем выигрыш на пяти.

Насколько мне известно, разница в выигрышах игроков в данном случае важнее (в контексте того, как выглядят равновесия), чем вид бюджетного ограничения (фиксированный размер армии в Блотто против линейных издержек, предполагаемых в аукционах).

Равновесия Нэша в аукционах китайских палочек всё ещё описываются смешанными стратегиями, но вид этих равновесий прямо-таки завораживает. Давно известное равновесие[1] для трёх палочек говорит, что одно из равновесий описывается стратегией, которая задаётся равномерным распределением на поверхности тетраэдра в пространстве ставок на три палочки. Недавно было найдено ещё одно равновесие[2] (всё ещё для трёх палочек), которое берёт тот же тетраэдр и превращает его во фрактал в духе треугольника Серпинского. Равновесная стратегия в этом случае предполагает равномерное распределение ставок на поверхности этого фрактала.

Всё это написано к тому, чтобы сказать, что с математической точки зрения эксперимент автора интереса представляет мало, потому что игра уже решена и решена элегантно. Но из-за того, насколько устрашающе выглядят равновесия, эксперимент интересен с точки зрения исследования человеческого поведения — едва ли кто-то из участников честно рандомизировал на поверхности того фрактала. В частности, интересна асимметрия между полями — что многие (и победители в том числе) ставят больше на центральное поле, пренебрегая нижними полями. То есть, в данной популяции оптимально пренебрегать центральным полем, борясь вместо него за какие-то из более крайних.

[1] Szentes, Balázs, and Robert W. Rosenthal. “Three-Object Two-Bidder Simultaneous Auctions: Chopsticks and Tetrahedra.” Games and Economic Behavior 44, no. 1 (July 2003): 114–33. (paywalled)
[2] Ewerhart, Christian. “A ‘Fractal’ Solution to the Chopstick Auction.” Economic Theory, 2017, 1–17.

Nicknameless 26 фев 2019 в 12:36

Спасибо за такой подробный комментарий, будет что изучить (так как я недавно только начал изучать теорию игр).
Согласен, мне было больше интересно посмотреть как ведут себя люди в этой игре, попробовать найти какие-то закономерности в их стратегиях.

Подведение итогов онлайн контеста по игре Блотто

Комментарии 7

Публикации