Как стать автором
Обновить

Комментарии 33

Ранее ИИ не мог победить там, где присутствует элемент неопределенности.

Да ладно.
К стати да, интуитивными решениями вероятностных задач человеки не блещут, в отличии от тупо считающих, тупо ботов!
Как заядлый ботовод, замечу, онлайн-покер он уже того, и для этого не надо суперхитроделаных ботов (хотя это действительно весьма занятная область), достаточно хотя-бы паре оказаться за одним столом с «мясом» и роботы уже имеют статистическое преимущество… И таких виртуальных катал, онлайн покеррумы сами-же и плодили с начала времён, для понятных целей…
ИМХО смысл покера в психологии, в него интересно играть лишь с живыми людьми за реальным столом, лудоманам-же всё равно что фрукты, что три семи сегментных индикатора за пятачок, что покер рум в тырьнете!
Ну и как покерная карьера? Много так выиграли?
Смерть онлай-покера, как следствие победы Libratus — это, мягко говоря, туфта полная.

Во первых, как корректно указано в статье, хедзап (1 оппонент) на котором бот показал победу, и 6-9 оппонентов за столом — это просто космическая разница по требуемым вычислительным мощностям. На очень-очень много порядков.

Во вторых, даже для одного оппонента — на работу этого чуда научной мысли потребовался взрослый суперкомпьютер. Дальнейший рост мощностей суперкомпьютеров жестко лимитирован и в целом практически себя исчерпал (чисто с инженерной точки зрения, не существует никаких решений, ни практических ни теоретических, для того чтобы повысить мощность суперкомпьютеров на 3-4 порядка сохранив относительную компактность суперкомпьютера и как-то при этом сумев отвести соответствующее кол-во тепла, а если жертвовать компактностью то на подавляющем большинстве задач решаемых суперкомпьютерами резко падает весь смысл распараллеливания в силу сопутствующих «накладных расходов времени»).

Далее. Сам используемый алгоритм, судя по косвенной информации, вычисляет оптимальную стратегию в каждой точке принятия решений. Т.е. прогоняет туеву хучу возможных стратегий, возможных вариантов адаптации к ним, и находит оптимум. Это такой титанический брутфорс что он в принципе не масштабируется на обычные PC или даже небольшие кластеры из оных. И это останется так по меньшей мере в ближайшие 10-15 лет, ну или до появления доступных по стоимости квантовых компьютеров (бгггггг).
А представить себе суперкомпьюетр на котором постоянно крутится покербот для игры на лимитах ниже NL10000 совершенно невозможно (тупо никогда не отобьется, не рентабельно).

В сухом остатке — в рамках того подхода который (судя по общему описанию) использует Libratus, до практически применимого в онлайне (на обычных лимитах игры) «решения покера» как до луны пешком. Полученный результат интересен сугубо теоретически-фундаментально, как фактическое (хотя и совершенно не применимое на практике по назначению) доказательство того что машина может побить человека в игре с неполной информацией. Хотя в общем в этом и так глупо сомневаться — особенно если сама логика такой игры подразумевает массовые математические вычисления, где машина сильнее по определению…

Так что шуму много — а повода шуметь особо нет. Исходя из доступной инфы по покерботам, онлайн-покеру еще долго ничего не будет грозить (в смысле опасности от ботов — прочие факторы не обсуждаю).
Ну дык раньше для шахмат тоже нужен был суперкомпьютер. А сейчас простой i3 легко в сухую порвет Карлсена. Так что появление ботов легко обыгрывающих людей это дело времени. Причем не факт что далекого. Та же программа для го из среднячка в чемпиона всего за год превратилась.
появление ботов легко обыгрывающих людей это дело времени


С этим спорить, разумеется, глупо. Это действительно вопрос времени.
Но утверждать что победа Libratus хоть в какой-то значимой мере приблизила это время — это тоже глупо.
Вот когда появится бот действующий не перебором стратегий, а более умно (т.е. требующий на 3-5 порядков меньше вычислительных мощностей), вот тогда да. Но подобных алгоритмов пока в открытом доступе нет вообще, и нет даже сколь-нибудь вменяемого намека на оные.

P.S. ну и да, если даже случится чудо — все равно дальше остается Омаха, где на руках в 2 раза больше карт — а это очередной взрыв вычислительной сложности.
С этим спорить, разумеется, глупо.

Давайте я поспорю. Почему-то на сегодня не создали ни одного. И почему-то нет никаких серьезных заявлений, как с альфа-го например. А казалось бы, уже пора такого мегабота сделать. Ведь тут на кону далеко не шахматные деньги.

А разгадка банальна: ГСЧ. Т. е. выигрыши в кокере распределяются случайно.
И любому 13-летнему школьнику под силу обыграть самый жесткий суперкомпьютер, потому что ему может тупо повезти с первой раздачи, где он пойдет ва банк, а ИИ алгоритм посчитает, что одолеет удачливого школуна. Тут никакого чуда просто не может произойти, а все вместе это называется — азартная игра.
Э, нет. Судя по ответу вы совсем не знаете что такое покер. Если игрок учитывает доступную ему информацию то покер к азартным играм он не относится никак — от слова «совсем». Это в чистом виде математика — как в шахматах, только сильно (очень сильно) сложнее. Т.е. выигрышь или проигрышь на длительной дистанции (за очень много партий) на 100% не зависит от ГСЧ, а зависит только от интеллекта и навыков игрока. Почитайте профильную литературу — поймёте.
Это ту литературу, которая сплошь написана лудоманами (типа профессиональные игроки) для завлечения в их лудомир?
Математика шахмат не предполагает наличия ГСЧ. А тут на любой дистанции — ГСЧ присутствует.
И как определить эту дистанцию? В каком случае она будет достаточно длинной? Ведь если посадить рядом человека и машину, дав сыграть до победы, то партия может завершиться и на первой раздаче. И это будет полностью в рамках правил покера. Таким образом даже 13-летний индиго из 6-го б может спокойно одолеть чемпиона мира. Вот такая математика.
Вы даже не понимаете что такое дистанция — на счет этого вопроса как раз математика очень точно говорит что такое «достаточно длинный». И что такое победа в покере вы как следствие тоже не понимаете. При чему тут одна партия (в покере она называется раздачей, или же рукой). Покерная дистанция (разумеется речь про безлимитный холдем, в лимитном всё действительно давно решено) это миллионы (!) раздач. Просто потому что скажем при 100 000 раздач (а это то, что игрок, плотно занимающийся покером, наиграет чуть более чем за месяц) действительно ГСЧ может запросто «передавить» плюсовое матожидание действий игрока. Одна партия для опытного игрока это вообще просто статистическая погрешность, и вообще не важно повезло ему с раздачей карт или не повезло. И легко бывают ситуации даже у очень сильных плюсовых игроков когда на протяжении 200-300 тысяч раздач они имеют минус при реально сильной плюсовой игре. Это обычное дело — не сделать ни одной ошибки, играть по математике в сильный плюс, а иметь по факту сильный минус. Именно потому что ГСЧ. Но, к счастью, ровно по той же математике, матожидание зависящее от скилла игрока — растёт с кол-во сыгранный партий линейно, а матожидание случайного блуждания от ГСЧ растёт, грубо, как корень (!) из кол-ва партий (матожидание это на бытовом языке усредненный ожидаемый результат). Корень растёт сильно медленнее нежели линейная зависимость. Так что при миллионе раздач — уже хорошо видно каков реальный уровень игры, и ГСЧ тут уже вообще будет совершенно не при чем. Исходя из описанного, победа в покере вообще отсутствует как понятие (результат одной раздачи просто не имеет значения, никакого, вот совсем-совсем никакого). Присутствует или отсутствует только долговременный выигрышь на дистанции (т.е. на миллионах сыгранных партий), т.е. умеет ли игрок «бить игру» в длительной перспективе или не умеет. И разумеется указанные выше цифры по кол-ву раздач (100к, 1000к) это скорее общие индикативы. Потому как сами эти цифры есть математическая функция от матожидания игры — чем оно выше тем меньше надо раздач чтобы всё стало понятно, а чем ниже — тем больше надо раздач. И это всё строго математически рассчитывается. В общем, изучите хотя-бы самые азы математики ГСЧ и покера. Иначе ваши комментарии это как комментарии зимбабвийского астронавта про то как правильно танцевать балет.

Другой вопрос, что покер может быть азартной игрой. В случае если игрок не заморачивается на самообучение на миллионах партий, а просто фигачит ставки ваще не включая мозг. Вот тогда да, это уже не игра интеллекта а в чистом виде азартная игра (ровно потому что играя против думающих оппонентов он гарантированно будет проигрывать в длительной перспективе, а это и есть определение азартных игр — азартная игра это игра где в длительной перспективе у игрока отрицательное матожидание, при этом в отдельных партиях может повезти). Но тут как бы надо отделять мухи от котлет. Утверждать что безлимитный покер сам по себе есть азартная игра ну никак нельзя. А то что он может быть азартной игррой если человек играет без мозга и лудоманит — так ктож возражает. Но в этом смысле и шахматы могут считаться азартной игрой ровно точно так же (факт наличия или отсутствия внешнего ГСЧ в этом смысле вообще не важен). Берем людей, не умеющих играть в шахматы, сажаем их в партии на деньги. Одни начнут много думать и улучшат игру, другие мозг влючать не захотят (или захотят но просто не смогут). Первые будут стабильно зарабатывать, вторые — проигрывать (хотя, иногда, и выигрывать, когда повезёт и оппонент ступит в силу малости опыта, в таком случае для них ГСЧ примет вид ошибок оппонента).
Есть победа в покерной раздаче, а есть победа — на турнире. Турнир — это не миллион раздач. А в среднем — пару тысяч для одного игрока. Это длинная или короткая дистанция?
По-вашему — это короткая дистанция. Но это реальность каждого турнира.

И легко бывают ситуации даже у очень сильных плюсовых игроков когда на протяжении 200-300 тысяч раздач они имеют минус при реально сильной плюсовой игре.

Как и ситуации, когда на турнирах побеждают дети, уделывая так называемых «топовых игроков».

хорошо видно каков реальный уровень игры

А потом происходит ситуация слива и этот «уровень игры» проседает.

Утверждать что безлимитный покер сам по себе есть азартная игра ну никак нельзя.

Можно, потому что турниры выигрывают новички и часто. Что это, если не случайное распределение? Пример с шахматами — не релевантен. Потому что даже за миллион партий вы вряд ли хоть в одной обыграете не то что Магнуса Карлсена, но и средненький ИИ на максах. А в покере турнирная партия может длиться и одну раздачу. И победить в ней довольно просто, получив хорошую руку против хорошей руки.

Утверждать что безлимитный покер сам по себе есть азартная игра ну никак нельзя. А то что он может быть азартной игррой если человек играет без мозга и лудоманит — так ктож возражает.


Я как бы и возражаю, доказывая тут на примерах, что абсолютно все игроки в покер — лудоманы. Одни более везучие, другие менее. И совершенно любые знания и опыт не помогут вам выиграть в одной конкретной раздаче.
возражаю, доказывая тут на примерах, что абсолютно все игроки в покер — лудоманы. Одни более везучие, другие менее


Примеры которые вы приводите не содержат ни капли логики. Судя по Вашим примерам, вы математически невежественны и поэтому воспринимаете покер через призму эмоций а не логики. Вот как раз такие люди — действительно имеют нулевые шансы на долговременный успех в покере, так что для Вас лично похоже покер действительно азартная игра. Ну раз хочется вам истово верить что все покеристы лудоманы — ну ОК, такая у вас странная вера. Но выглядит эта ваша вера откровенно неумно для любого человека знающего теорвер и хотя-бы самые основы покера (вы, очевидно, не знаете ни того ни другого).
То есть пример с детьми, побеждающими «топ игроков» на турнирах — это не в счет. Но это же факты.
Как и то, что на турнирах часто побеждают совсем новички, в отличие от шахмат и го.

И где отсутствие логики в том, что вас, суперпрофессионального игрока за столом может легко уделать простой школьник?

От вас я услышал только то, что я невежественен в этих вопросах. Но при этом ответить на мои тезисы вы почему-то не захотели. Есть еще другая статистика:
Previous research has shown that online poker players may be at a high risk of developing gambling problems and that there are various personality traits that may be associated with such risk. An online survey comprising 256 poker players (50.8 % professional players and 49.2 % recreational players) examined various aspects of their poker playing behavior. The goals of the study were to investigate: (i) the playing motivations of recreational and professional Texas Hold’em poker players, (ii) the psychological characteristics of online poker players in relation to narcissism, impulsivity, self-esteem, and problem gambling, and (iii) the differences between professional and recreational poker player on these psychological variables. Results showed that only 1.6 % poker players met the DSM-IV-TR diagnostic criteria for pathological gambling (n = 4). Generally, poker players had low scores on narcissism and impulsivity, and high scores on self-esteem. Implications for the study of online poker gambling are also discussed.

Как у вас с нарциссизмом и импульсивностью? По-моему однозначный можно вывод сделать.
Суперпрофессионального игрока никогда не сможет уделать школьник если сыграет с ним хотя-бы 50-100 тысяч раздачь. Никогда и никак. Вы этого видимо понять не в состоянии, и живёте в мире своих иллюзий основанном на полном непонимании законов вероятности. Тут бессмысленно что-то обьяснять — вы и не поймёте и не захотите понять, потому что вера не бьется логикой, а у вас именно что вера основанная на нехватке образования по обсуждаемому предмету. Более того, вы даже не удосужились прочитать тот текст который привели. Ну так я вам переведу.

Results showed that only 1.6 % poker players met the DSM-IV-TR diagnostic criteria for pathological gambling (n = 4). Generally, poker players had low scores on narcissism and impulsivity, and high scores on self-esteem.

Результаты показывают что только 1.6% игроков в покер удовлетворяют DSM-IV-TR диагностическому критерию патологии гэймблинга (n=4). В целом, покерные игроки имеют низкий уровень нарциссизма и импульсивности, и высокий уровень самоанализа.

Иначе говоря, приведённый вами текст прямо говорит, что исследования подтвердили, что игроки в покер — спокойные, рассудительные люди с аналитическим складом ума и без игорной зависимости, и лишь у полутора процентов игроков есть проблемы в виде игорной зависимости. Бугогашеньки.
Так у вас и есть — вера в «законы вероятности» и то, что школьник не сможет обыграть на дистанции 50-100 тысяч.
Хотя в реальности — такие примеры есть, и 15-летние брали турниры на миллионы. Вы хоть один брали? Нет. Вот школьнику и повезло с вероятностью.
Зачем такая дистанция? Неужели законы вероятности не работают на турнирах, где дистанция всего лишь 5 тысяч?

Я привел пример исследования, основанного на «онлайн опросе», который полностью успокаивает лудоманов и говорит им — играйте дальше.
Неужели законы вероятности не работают на турнирах, где дистанция всего лишь 5 тысяч?

Ну вы лишний раз продемонстрировали что вообще не понимаете того в чем пытаетесь теоретизировать. На дистанции в 5 тысяч результат в среднем очень близок к полностью случайному — это математический факт. С точностью до умения читать оппонента по его мимике и жестам что вообще отдельная тема. Поэтому да, школьнику может повезти (один раз из сотни или тысячи турниров) и он выиграет один турнир. Продолжайте нести чушь, у вас это хорошо получается.

Для справки, совершенно нормальная (т.е. вполне вероятная с математической точки зрения, и реально случающаяся с топовыми игроками) ситуация в омаху (это по сути сильно более дисперсный вариант покера) когда игрок миллион (!) раздач играет в фактический минус или ноль, при том что математически у него должен быть хороший плюс (по вероятностям выхода карт — но ему не везло в этот миллион рук, и не везло именно на крупных банках). И тут нет ни неожиданностей, ни парадоксов, ни обмана со стороны покеррума, это просто математика вероятностей, которая именно такова. И нужно иметь сильную волю и самодисциплину чтобы продолжать играть в вероятный плюс имея фактический минус. Но именно это и отличает про-игроков от любителей, которые на таком вот нефарте сливают деньги а потом идут кричать что «да это всё кидалово и системно выигрывать невозможно». Сильно подозреваю что вы как раз из таких.
Конечно понимаю. Математический факт в том, что нет такой дистанции, для которой не будет случайности.
Ну и даже если предположить, как по-вашему, что дистанция 5 тысяч — случайность (а типа 200к не случайность, только кто это решил — не понятно). Тогда нужно отбросить ВООБЩЕ все турниры по покеру. Ведь именно такая дистанция там и есть.

Что ж это получается у лудоманов? Что любой турнир, оказывается, случайность, так? Вы это сами подтвердили.

Чушь — это говорить про отсутствие ГСЧ в игре. Вам внушили, что есть некие лудоманские специальные навыки для победы, вы в это и поверили. Еще и написали кучу макулатуры для подтверждения и завлечения.

А школьников мало турниры выигрывает только потому, что у них не у каждого есть время, деньги и усидчивость. А вот молодых игроков в возрасте 18-25 лет — да тысячи. И они поднимают турниры за 2-3 года лудокарьеры, обыгрывая «маститых профи».

Ага истории про минус, играет в минус или ноль, а потом идет продавать имущество. Вполне вероятная случающаяся с топовыми игроками ситуация. С многими, кто не догадался подвязаться на рекламные контракты, а решил «зарабатывать» покером.

Неожиданность, так сказать. Дисциплина подвела, или еще чего-то там. И лудокарьера под хвост. Профукивает лудоман все везение, и объявляет себя банкротом. Такое случается в мире покера гораздо чаще, чем математика вероятностей, которая помогает лудоману после миллиона раздач не в его сторону.
Ну понятно. Кучка пустой демагогии и ни одного количественного аргумента (можно это упростить до «ни одного аргумента»). Роль и влияние ГСЧ на дистанции я вам подробно расписал в комментарии выше. Когда выучите матчасть, разберетесь в классической задачке про пьяного матроса, и сможете понять этот комментарий — тогда будет смысл продолжать общение. Иначе в голову приходит только поговорка где про бисер и свиней. Успехов вам в самообразовании.
Даа, неудобненько, когда фактами приперли.

Так я и хочу услышать количественный аргумент, а слышу только совсем уж жалкие отговорки.

Вот матчасть без матросов: есть некая дистанция в покере, на которой показывает себя профи. Эта дистанция названа в комментарии. 50 000. То есть до этого — ни о какой дистанции речи не идет и на меньшей дистанции по заверениям самого лудомана — его может обыграть школотрон. Свинка, а как это вышло, что ни один турнир этой дистанции не достигает? И вообще, откуда цифра? Только не говори, свинка, что ты ее придумала просто так с потолка, а то вообще лужа будет. И с пьяными матросами, не сюда. Потому что мы не живем в идеальном мире, а матрос может и окочуриться на второй пивной.

Неудобно со свинкой вышло. Нервишки у кокериста сдают, вот оно и дергается, полагаясь на «дистанцию», сливая все подряд.
Очередная порция пустоты и демагогии. У неумного тролля нервишки явно пошаливают. Учите матчасть, вьюноша, конкретно — теорвер и «задача пьяного матроса».
Ну и как там с ИИ в покере?

Уже обыграл всех оппонентов?

Что теория вероятности говорит на этот счет?

Ответ в задаче про пьяного матроса, вьюноша, пропорционально корню из времени. Но проблема в том, что эту задачу нельзя применить для того, чтобы определить победителя в турнире по покеру.

Как бы вы не рассчитывали распределение в сетке турнира. Все равно только игра определит места и победителя.

Короче, вьюноша. Когда изобретут ИИ, который умеет играть и обыгрывать в покер, тогда и позовете (никогда).
О, лёд тронулся! Пришло понимание случайного результата как корень от времени. Отлично. Теперь двигаемся дальше. Берем ситуацию когда человек играет хорошо, т.е. имеет некоторый (вообще не важно какой) преимущество над более чем половиной игроков. Есть такие люди? Как в любой игре, конечно есть. Кто-то умеет анализировать шансы и вероятности лучше, кто-то хуже. А если у человека есть такое, статистическое, преимущество ответьте мне, как будет расти его статистический выигрышь за вычетом случайного блуждание? Подсказка. Линейно будет расти от времени, с некоторым углом наклона пропорциональным величине преимущества. Значит итоговый результат от времени — это случайность (как корень из времени) плюс системность (как линейность от времени). На малом кол-ве партий случайность разумеется легко бьет системность. На большом — системность всегда переборет случайность. Потому что линейность растет быстрее чем корень. Что и требовалось доказать. А турниры в покер на которые вы тут отчаянно ссылаетесь не имеют отношения к делу вообще — это как раз супер короткий период времени. И «проблемы определить победителя в турнире» её нет — проводишь турнир и находишь победителя как бы. Турни это что-нить типа сотни партий. Статистически выигрывать в них — ессно можно (за очень большое кол-во турниров), а в конкретном турнире — это действительно скорее случайность нежели закономерность. Что вообще никак не говорит о том что покер в целом это рулетка. Покер в рамках турнира — во многом рулетка, т.е. вес случайности велик потому что мало партий (но и вес скилла тоже отнюдь не мал). Покер при постоянной игре, когда речь про пару миллионов партий за год (а это типовая цифра для профессионалов) — тут случайность уже не играет никакой роли, от слова «совсем», и всё определяется умениями игрока. И да, ИИ который умеет обыгрывать одного игрока в покер — такой ИИ уже несколько лет как существует (вначале копит статистику на действия оппонента, а через сотни десятки тысяч раздач с ним начинает рвать его как тряпочку), другой вопрос что технически пока не смогли «растянуть» этот же алгоритм на большое кол-во оппонентов, но это вопрос технический, со временем решат.
Все еще жду ИИ, который обыгрывает игроков.

Но что-то не дождался.
такой ИИ уже несколько лет как существует

Само собой — брехня.
А сейчас простой i3 легко в сухую порвет Карлсена.

Не знаток шахмат, но мне почему-то кажется, что рвать в сухую Карлсена сейчас способны только суперкомпьютеры, никаким i3-5-7 это не под силу.
Не знаток шахмат
. В этом и дело, даже телефон уже выиграет у Карлсена, даже при 15 секундах на ход, просто компьютер считает гораздо быстрее, чем человек и оперативная память большая. В общем текущие программы имеют очень хорошие алгоритмы.
> Дальнейший рост мощностей суперкомпьютеров жестко лимитирован и в целом практически себя исчерпал.
«640 килобайт хватит всем!» (с) Билл Гейтс. Никто (даже в майкрософт) тогда не думал, что всего через пару десятков лет у людей дома будут стоять терабайтники, поэтому ваше утверждение:

> как до луны пешком
Как минимум настолько же ошибочно, как и людей из майкрософт. Никто не знает, какие компьютеры будут через 20 лет, а вот то, что в покер всё еще будут играть — сомневаться не приходится.

> для того чтобы повысить мощность суперкомпьютеров на 3-4 порядка
А зачем суперкомпьютеру увеличивать мощность еще на 3-4 порядка, если он и так всех обыграл?

> Далее. Сам используемый алгоритм, судя по косвенной информации, вычисляет оптимальную стратегию в каждой точке принятия решений
Вы этого точно не знаете.
Это как с биткоином — будет выгодно — выпустят ASIC«и, заточенные специально под покер и ничего кроме этого не умеющие и в плане пользы человечеству бесполезные.
Лимитный холдем не является самым популярным видом покера
>У ИИ остается только теория игр для поиска оптимальных стратегий
да я и с этим не соглашусь.
А гибирид человек+машина возможен? Возможно в этом случае требования к вычислительным мощностям были бы на порядки меньше, а эффективность выше.
Возможный вариант реализации: компьютер показывает человеку дополнительную информацию, которую он в принципе может просчитать (например возможные карты у оппонентов, исходя из того, что уже было, может быть время реакции оппонентов). А человек уже имея эту расширенную информацию принимает решения.
По сути именно так сейчас и происходит. Есть приложения, которые имеют общую базу собранной статистики, в процессе игры продолжают ее собирать и предоставлять своим пользователям. Даже если вы видите оппонента первый раз, вы все равно будете видеть его статистику за столом, потому что он когда-то играл с другими пользователями, у которых было это приложение.
К сожалению не смотрел турниры с ИИ, но играл ли там кто то из обладателей серьезных браслетов?
Интересен был бы результат против интуитивщиков типа Даниэль Негреану, хотя он еще и людей шикарно читает. Но особенно интересно какой результат был бы против супер тайтовых игроков типа Криса Фергюсона котрой к тому же профессор математики а диссертация была посвящена алгоритмам для виртуальных сетей.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий