Как стать автором
Обновить

Комментарии 45

По мнению сотрудников Карнеги-Меллон, возможности Libratus можно использовать в кибербезопасности, при переговорах, в военных целях.

Вангую, через N лет на недоуменное «Почему меня не взяли на эту работу» или «Почему ты не выйдешь за меня?» получишь ответ «Так сказала Машина».
С кредитами в банке уже так и есть.
при переговорах, в военных целях.

А вот я, прочитав, представил следующий «фильм» — с одной стороны стола переговоров — крупный государственный деятель эпохи генсек Брежнев с другой — программа: каждый блефует насмерть. Оба игрока имеют в качестве ставок ядерное оружие и право его применения, население своих стран… ещё «газовые переговоры» можно вспомнить.
Обострять противостояние, как мне кажется, можно, если есть гарантия в 99.999% что не будет ответного удара. Выгоды почти никакой, а убытки весьма существенны, на фоне современного хрупкого глобального равновесия, сложных связей. Выгоду получит третья сторона, что останется в стороне от конфликта.
Для обучения нейронной сети тут мало информации, повторной игры не будет.

Насчёт лучших игроков авторы статьи, пожалуй, немного погорячились)

Сначала пусть попробует моего деда в переводного дурака обыграть.
это представляет хотя бы какую-нибудь сложность? учитывая что игра по сути на память, запомнить какие карты выбыли из игры, какие «забрал» противник. А у компьютера как известно с памятью проблем нету. или это такая странная шутка?
{facepalm} Да. Это была шутка на тему превосходства олдскульного лампового мастерства над современными бездушными цифровыми технологиями.
Вы очём? Это не блэк-джек. раздаётся по две карты участникам, затем пять карт выкладывается на стол(в таком порядке: 3-1-1). В итоге участнике выбирают из семи карт лучшие пять для покерной комбинации. Ничего запоминать не надо. Просто надо умело торговаться, блефовать и тд за те общие карты(3-1-1), которые выкладывают на стол(это общие карты, помимо двух то выдают изначально каждому игроку). Короче…

ой, вы это про дурака)

ИИ научился обыгрывать человека в шахматы.
ИИ обыграл человека в покер.
ИИ спустил выигрыш на кокаин и шлюх.

Вообщето здесь попахивает крахом он-лайн покера, так как это БОТ. А борьба с ботами в он-лайн покере типа ведётся не на жизнь, а на смерть. Вы понимайте, что я например готов выложить 1К баксов за такой алгоритм, залить на свой счёт ещё 1К баксов и спокойно пойти на основную работу. Придя домой вечером, я обнаружу на своём счёте не знаю какой плюс. Как минимум не уходить в минус — это задача всех существующих "пиратских" ботов. Для чего играть в нуль? Есть такое понятие во многих он-лайн покер-румах, как рейк-бек. То есть вам казино возвращает некоторый процент от прокрученных денег. Если вы в нуле и играйте на интересных(не мизерных) ставках, то вам обеспеченна зарплата. он-лайн профессионалы играют примерно в нуль. Редко уходят в минус, и иногда(чаще) имеют плюс. Люди тупо бросают учёбу и живут покером.
А тут БОТ выигрывает.
Это революция?!!!!

НЛО прилетело и опубликовало эту надпись здесь

Либо я не правильно выразился, либо вы абы как вникаете.
1) Где я писал, что боты это новость?
2) Уровень на котором они играют не могу комментировать, но когда я интересовался, играющие в ноль боты стоили десятки или около сотни другой долларов. Бесплатных то ли не было, то ли туповатые были.
3) Во втором предложении своего коммента, я пишу, как раз о том, что борьба с ботами ведётся не шуточная.


Простите, но Вы, с кармой -12, читайте внимательней и будьте бдительней, прежде чем пугать кого-то баном.

Вы понимайте, что я например готов выложить 1К баксов за такой алгоритм, залить на свой счёт ещё 1К баксов и спокойно пойти на основную работу.

Общее время вычислений составило примерно 15 миллионов ядро-часов

Предварительно купив небольшое здание вместе с суперкомпьютером.
Облака. Главное что бы профит превышал стоимость аренды.
Мне кажется или сложно найти облако, которое будет выделять такие мощности периодическими «пиками»?
А точно нужны именно такие пики? ведь это общее время за 120 тысяч раздач
Если по полчаса на раздачу, то 250 ядер. Это только при условии, что нагрузка на ядра равномерно распределена по времени.
Небольшая поправка:

Общая продолжительность турнира составила 20 дней


То есть 480 реальных часов. Даже если предположить, что играл компьютер круглосуточно, то нужно минимум 15 000 000 / 480 = 31 250 ядер.
Не нужно десятков тысяч ядер — если читали предыдущую (гораздо более подробную и толковую) новость, то это указано процессорное время не на игру в этом конкретном турнире, а на разработку алгоритма бота и его обучения(тренировки), когда программа анализировала записи миллионов чужих игр и играла миллионы игр против самой себя отрабатывая и настраивая алгоритмы.

После обучения (разового) на саму последующую игру обычно уходит на несколько порядков меньше вычислительных мощностей.
31 250 ядер на 20 дней выйдут дорого

Я не спец по ядро-часам, ща загуглю. Принято и учту в след раз.

120 тысяч раздач
Общая продолжительность турнира составила 20 дней


То есть 480 реальных часов. Даже если предположить, что играл компьютер круглосуточно, то нужно минимум 15 000 000 / 480 = 31 250 ядер.
И что вы здесь насчитали?
(ядер/час)/час = ядер/(час*час), то есть ядер на часы в квадрате.

120000/480=250 — кол. ядер/часов на одну раздачу, но это затраты на победу в турнире, с практической точки зрения же нужно, чтобы бот приносил владельцу небольшой доход, а для этого нужно выигрывать у весьма средних игроков с заметным снижением КПД. И еще неизвестно какими ядрами они считали, если предположить максимальные i7, то в итоге одному процессору нужно 25 процессор/часов, но там скорее всего сильно слабее ядра учитывались.
Вообщем я тоже криво насчитал)
И что вы здесь насчитали?


Вполне нормальные расчеты. Пример: разработка программы заняла 8 часов, суммарные затраты оценены в 80 человекочасов. Минимум сколько программистов занималось разработкой?
предположить максимальные i7, то в итоге одному процессору нужно 25 процессор/часов

Можете посмотреть, разница в производительности между одним ядром самого топового i7 и самого бюджетного Celeron в одной линейке до 50%. Откуда разница в 25 раз?

image
Я не писал про разницу в 25 раз. 25 часов потребуется на раздачу процессору i7, при условии, что расчет велся в его ядрах, а не каких-нибудь ARM.
В том суперкомпьютере используют Xeon.

https://www.psc.edu/index.php/resources/computing/bridges
Никакой сенсации здесь нет. Судя по всему, уже давно существуют серый бизнес, где собирают целые команды программистов, пишут и тестируют бота, его ставят различным реальным людям, желающим подзаработать, в виде подсказчика, таким образом технически вычислить практически невозможно, поэтому банят только по прошествии времени и жалоб от регуляров.

Таким образом, из покера выкачиваются миллионы долларов, многочисленные случаи всплывали на мидстейкс Холдема, Омахи, а в последнее время сетки ботов всплывают и в турнирах МТТ. При этом они штампуют новые аккаунты и мигрируют в разные покер-румы, где борьба с ними слабая и сильно заторможенная.

http://botpoker.ru/
Авторы в самом деле хвастаются высоким уровнем бота, нижа на заглавной представлены графики вин-рейтов, а ценник 3500р, 2100р по скидке.
Первое что попалось в гугле. Не знаю, раньше я тыкал спец. форумы, там были разного рода студенческие боты играющие в нуль.
Что сказать — прогресс не стоит на месте..

Вот только в онлайне игроки постоянно меняются — не получится провести несколько тысяч раздач с каждым, чтоб вычислить его блефы и т.д.
А еще в онлайне полно всяких безбашшеный алл-инщиков, особонно на низких лимитах, а доехать может на любых двух картах — такое тоже не угадаешь.
мое ИМХО что к такому боту надо еще базу по игрокам прикручивать, и первые насколько месяцев посадить сливать деньги, чтоб эту базу наполнить — может быть тогда какой-то профит и будет.

На "старсах" текучка огромная, особенно на низких лимитах, вряд и получиться собрать толковую базу по игрокам. Чего не скажешь, про лимиты повыше(где ставки выше — для тех кто не в теме), но там даже в "зум румах" половина регов минимум — всё теже лица. Канеш со временем происходит ротация, но вполне себе такую базу на локальный период набить можно и соответственно корректировать. Да прикручивать надо.

Ну и фактор времени — 20 дней против одних и тех же 4х соперников.
А если соперников будет хотябы 400 разных, то для такого же результата надо будет более 5ти лет играть…
И это при условии, что каждый из соперников будет 6000 раздач в день с ботом играть.
Очень большой стэк надо будет боту предоставить, чтоб он за первые пару лет не слился :)
Кажется, в недалеком будущем терминаторы будут спрашивать своих жертв «проблемы с доступом к Джойказино?»
Он как будто более умелая наша версия

Не хочется ребят огорчать, но…
DeepStack использует равновесие Нэша. и DeepStack противодействует попыткам использовать собственную стратегию другими игроками.
Как это совместимо? Если он использует стратегию, в которой достигается равновесие, то он не должен пытаться предугадать стратегию соперника. Если он пытается предсказать (например, предположить, что стратегия такая же, как у него — хотя для равновесной стратегии это не очень осмыслено), то его стратегия может перестать быть равновесной и его можно обмануть.
меня одного мучает вопрос, что будет если посадить играть 4 ИИ DS друг с другом?

Набьют друг другу морду? Фантазировать не буду, но как писали выше, если учесть используемые ядра-ресуры, то лучше их слить на прокачку бит-коинов, нет?

безусловно — лучше и эффективней. Но интересней-то посмотреть на битву ИИ. Окупить часы предлагаю с помощью тотализатора!
В последнее время появилось очень много статей про покер, про боты в покере.
В одной из них упоминалось про рейк и рейкбЭк. Так вот это основа, основ в Покере как бизнеса.
Другое дело, что онлайн-румы очень эффективно ведут борьбу с ботами и прочим ЗЛОстным сопутствующим ПО.
В плюсового бота не верю, от слова совсем (ну разве что +5% РОИ), да и то нужно выверять, не за 48К кило рук, и даже не за 120К рук в МТТ, а допустим 1,5М-2М рук на кэшстолах, или столько же рук в СНГ супертурбо 6мах турнирчиках по рублю (от бакса и выше). А таких данных НЕТ. Оперируемость значениями сыгранных рук идёт на порядки ниже, и даже неизвестно, это просто сыгранные руки или это рейкРуки.

Никакой бот, а точнее никакие алгоритмы в покере не помогут, игра больше расчитана на психологию, на то что бы заставить оппа ошибиться. Допустим, слоуПлей, никакой бот не выявит и не сыграет как полагается, так же существуют МАРГИНАЛЬНЫЕ (ниже средней руки) стартовые карты (если пришли вам), которые играются более-менее агрессивно. Здесь никакой алгоритм не поможет.

Единственное, что авторы покер-ботов приблизили свои алгоритмы (движок) к околоНулевому регу, тогда да, баланс в ноль, т. е. неизменяемый на протяжении всего времени, и профит за счёт рэйкБэка (кэшБэка). В принципе ничего не мешает и без ботов набивать по 3К евро рейка в мес. при возврате с этой суммы от 900 до 1,5К евро.

Ну а покер-румы скорее всего будут рады такому «регу» (покер-боту), который молотит им средний рэйк. )))
Ещё раз повторюсь, румы не допустят перегиб в СИЛЬНО плюсовую сторону.

В общем согласен. Я придерживаюсь такой же оценки этого рынка. Хоть давно и не интересовался им.

Решил написать комментарий, поскольку играю в покер на сносном уровне и за событиями следил очень пристально:
1. Игроки действительно топовые в формате HU NLHE, то есть один на один. Все они входят в команду Дага Полка (Doug Polk), все четверо в числе десяти-пятнадцати лучших игроков в этом формате.
2. Прямой угрозы онлайн покеру сейчас еще нет: во-первых, сайты уже давно резко сократили долю игр 1-на-1 (по другой причине, не связанной с ботами: в формате 1-на-1 любители проигрывают деньги слишком быстро, сайтам такое невыгодно). Во-вторых, боты — дело рутинное, и контроль за этим тоже очень пристальный. В-третьих, показать аналогичный уровень игры за 6-местным столом у компьютера пока не получится.
3. Джейсон Лез (Jason Les), участник матча с Либратусом, отметил, что победа компьютера может негативно повлиять на хэдз-ап матчи на высокие ставки: там почасовая аренда суперкомпьютера может быть прибыльна. Но это маловероятное исключение.
4. В перспективе 5-10 лет все уже не так радужно, но и сам покер эволюционирует. Например, в сторону комбинированных игр. В них тип игры меняется каждые 5 минут, а в ротации типично участвуют 5-8 видов покера (холдем, омаха, стад, разз, и т.д.)
5. Либратус выиграл с абсурдно большим винрейтом (14.72бб/100), но позаимствовать его стратегию будет проблемно: слишком уж тонкая балансировка требуется. Под силу суперкомпьютеру, но едва ли доступно человеку, особенно в ходе игры.
6. В покере всё еще вполне хватает не слишком тяжелых денег, но объем необходимых знаний и количество часов на обучение за последние годы выросло в разы (и продолжит расти).
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории