AlphaGo уходит из го после победы «всухую» в серии матчей с чемпионом мира


    Пять профессиональных игроков в го не смогли ничего противопоставить натиску AlphaGo

    Представители компании DeepMind на днях заявили о том, что игра с Кэ Цзе была последним сражением компьютерной системы AlphaGo с человеком. После победы во всех трех матчах подряд стало понятно, что с компьютером человеку уже не совладать, поэтому для системы играть с другими чемпионами в го просто нет смысла, исход будущих матчей можно считать предрешенным. По словам главы DeepMind Демиса Хассабиса, AlphaGo достигла уже всех возможных высот в го, поэтому время сменить профиль и попробовать себя в новой сфере.

    Впервые весь мир услышал о компьютерном игроке в го чуть больше года назад, когда компьютер выиграл со счетом 4:1 у Ли Седоля, одного из чемпионов го. Никто не ожидал такого результата, поскольку эта игра считалась ранее сложной для компьютеров. Здесь огромное количество вариантов выбора хода, гораздо больше, чем в шахматах. По этой причине го считалась прерогативой человека. Но все меняется, компьютеры становятся совершеннее, так что современные программно-аппаратные платформы умеют то, чего не умели компьютеры всего пару-тройку лет назад.



    Напомню, что два года назад AlphaGo обыграла чемпиона Европы, после чего, год спустя, выиграла уже у одного из чемпионов мира Ли Седоля. Правда, ему тоже удалось добиться победы в одном из пяти матчей. Сейчас, после проигрыша Кэ Цзе это дало повод говорить, что Ли Седоль — последний человек, которому удалось победить AlphaGo, пускай и единожды.

    AlphaGo стала победителем во всех трех матчах с Кэ Цзе. В третьем матче китайский чемпион был вынужден сдаться, несмотря на то, что у него оставалось еще немногим более получаса на обдумывание ходов. Цзе играл белыми камнями, система — черными, так что первый ход сделала AlphaGo.


    Не только Кэ Цзе не справился с мощью AlphaGo, не одолели систему и пять других мастеров, которые играли против компьютера впятером одновременно. Матч завершился полной победой ИИ-платформы от DeepMind. Еще система сражалась сама с собой, само собой, выиграла и проиграла одновременно.

    Эксперты, следившие за ходом игры, утверждают, что профессионалы из мира го взяли на вооружение многие приемы, разработанные компьютером, которые и привели к победе системы.


    «Команда AlphaGo теперь бросит все силы на преодоление новых высот, разрабатывая различные алгоритмы, которые однажды помогут ученым решить наиболее сложные проблемы, например, определить пути распространения заболеваний, снизить энергопотребление в глобальном масштабе или создать революционно новые материалы», — заявил глава DeepMind.

    Также он сказал, что вся команда разработчиков всегда верила в то, что AlphaGo станет полезным для человечества. Например, эта система сможет помочь сделать какое-то открытие и извлечь из него пользу. А го — лишь пример того, на что способны современные технологии. Уже сейчас AlphaGo помог игрокам в го начать искать новые стратегические находки в игре, которые, в частности, использовал и Кэ Цзе. Определенно, это успех — ведь компьютер смог помочь найти новые интересные аспекты в игре, которой исполнилось уже 3000 лет.



    Интересно, что AlphaGo не станет общедоступным сервисом (как, например, IBM Watson). Разработчики будут использовать систему пока в закрытом режиме, пытаясь найти полезные и нужные варианты ее использования. В скором будущем DeepMind опубликует документы о том, как эта система смогла достичь высот и какие технологии при этом использовались.

    AlphaGo играла с людьми в рамках праздника го в китайском городе Вужень (провинция Чжэцзян). Первые две игры Кэ Цзе проиграл, так что уже после второго матча было понятно, что система выходит победителем, но оставалась еще и третья игра, участие в которой было делом чести для Цзэ.

    Что касается стиля игры системы, то один из профессиональных игроков в го сказал, что считает игру AlphaGo «человеческой». «AlphaGo играет очень уверенно, и это придает уверенности мне. Это помогает мне верить, что я могу управлять ходом игры», — заявил Лянь Сяо.

    Что будет делать AlphaGo дальше? Возможно, система начнет осваивать новые высоты в StarCraft II. Несколько месяцев назад создатели системы вместе с Blizzard объявили о намерении создать платформу для разработки ИИ-систем для игры в StarCraft II. Здесь компьютер еще поддается человеку, но, вероятно, вскоре это будет исправлено.
    Поделиться публикацией
    Комментарии 51
      +3
      когда-нибудь внукам я буду рассказывать о том как все начиналось.
        +21
        надеюсь, не в бункере под землёй ;)
        +1
        «AlphaGo играет очень уверенно, и это придает уверенности мне. Это помогает мне верить, что я могу управлять ходом игры», — заявил Лянь Сяо
        пфф! Разумеется, он был доволен ходом игры — он был единственным человеком, который закончил свою партию победой в эти пять дней. (ну и что, что это была парная игра, все равно — победа есть победа)
        А уж сравнивая его с Кэ Цзе, который три раза проиграл — так вообще, небо и земля :)

        PS: В статье пропущен ещё момент, что команда АльфаГо подсластили пилюлю для Кэ Цзе — они пригласили его к себе в команду, играть с\против АльфаГо и при этом видеть не только ход самого компа, но и его внутреннее состояние — оценку хода и расчёты вариантов. Плюс, доступ к партиям, которые он играл сам против себя при обучении (и ещё по 10-5 партий выложить в открытый доступ для всех, но это конечно не тот масштаб… )

          –5
          Вот не разу не логично, может чемпион человек играет шаблонно, его стратегию изучили и написали бота который гарантированно обыгрывает его. Дайте возможность поиграть всем, мож его любые другие чемпионы в Го вынесут.
            +2

            Ноуп, Альфа Го не знал с кем играет. Плюс его уже выпускали в онлайн драться с профи и он всех укатал без труда.

              +4
              Изучите хоть историю немного. Официальной встрече предшествовала серия из 60 партий, где AlphaGo под ником Master играл с самыми разными профессиональными игроками. Счет всей серии думаю объяснять не надо.

              Но как говорят сами разработчики, это все капля в море. Основную силу AlphaGo набрал, играя с самим собой.
              0
              Потрясающее достижение для DeepMind. Я до конца так и не понял — система будет отключена? Или в онлайне будет продолжать играть как Master?

              По поводу других применений — очень сложно будет собрать хорошие данные (для того же энергопотребления в масштабе мира). Может медицинские записи получше
                0
                А теперь натравите этот суперкомпьютер на доту
                  0

                  Учитывая что за читерство везде наказывают вплоть до 'вечного' бана, то игра будет 'интересной'.

                    0
                    Читерство? Насколько я знаю, использование ботов является читерством только если их вводят без преупреждения или выдают за игроков.
                      0

                      Собственно интриги в такой игре особо и нет.
                      Иначе необходимо вводить километровый список ограничений для ИИ.


                      Кстати, не так давно у американцев проходила симуляция воздушного боя с использованием с одной стороны ИИ и реальных пилотов с другой. Для реальных пилотов там было всё печально.

                    +3
                    Обучать сильнейший ИИ основам психологической войны? Ню-ню.
                      +1
                      Да и overkill — опускать им шутки про мамок.
                        0
                        Судя по тому, как медленно прогрессирует машинная обработка естественных языков, обучить ИИ шуткам про маму и тонкому троллингу будет на порядки сложнее, чем просто выигрывать.
                          +1

                          Интересно, троллинг какой толщины выберет нейросеть.

                            0
                            Примерно такой толщины, который бы заставил игрока-человека на несколько секунд забыть об игре и быстренько что-то написать в чат. И чем чаще и дольше можно будет удержать игрока-человека в таком состоянии, тем оптимальней толщина троллинга.

                            Зачем это всё? Просто это повышает шансы ИИ на победу, ибо в RTS игрок будет больше отвлекаться на гавканье с ИИ, нежели на войнушку. А ведь ИИ может одновременно и в чат писать и войсками/экономикой управлять, что уже является преимуществом.
                            0
                            А можно и не обучать троллингу, можно просто подключить модуль вполне прилично себя ведущего чат-бота чтобы ИИ «общался» в чате и таким образом отвлекал внимание от битвы игроков людей (или делал бы координацию их действий чуточку сложней из-за того что им пришлось бы мысленно отсеивать болтовню чат-бота). Как в одной истории про шахматиста из Техаса который заговаривал своему противнику зубы, и когда тот потерял из-за его болтовни внимательность поставил ему мат.
                              0
                              От спама спасает команда mute player. То есть троллинг должен быть таким чтоб именно зацепить и вызвать отклик, а не просто заставить потратить пол секунды чтобы замьютить спамера.

                              Например «Ваша смарт-плита уже выпустила 15 кубометров газа и через 30 секунд его зажжет»
                                0
                                «Don't feed trolls» — правило старое, но увы люди им часто пренебрегают. Для многих людей промолчать в ответ на троллинг (в особенности если это прямое хамство или как-то затрагивает их ценности) это всё равно что молча сносить телесные побои, у многих чешутся руки чтобы «дать сдачи», пусть и словесной.
                                  0
                                  Так способность переносить троллинг пропорциональна рейтингу. И если средний 12летний школьник забьет на игру и засядет за клаву строчить свой гнеффф от простого чат-бота с базой шуток про мамку, то профессионала уже прошибить сложнее
                                    0
                                    Ну да, теоретически против профессионала данная стратегия будет малоэффективно (хотя ещё не факт, достаточно развитый ИИ может оказаться тонким психологом: http://rationalwiki.org/wiki/AI-box_experiment http://lesswrong.com/lw/1pz/the_ai_in_a_box_boxes_you/ ). Зато такая мета-стратегия повысит игровой рейтинг ИИ за счёт более слабых и темпераментных игроков.
                                      0
                                      Так в том-то и шутка что ИИ будет обучаться все более изощренным и тонким методам троллинга, которые под конец позволят пронять даже профи )))
                                        0
                                        А может наоборот, человеческие тролли расколят тонкую душевную организацию ИИ и вгонят его в депрессию? :)
                                          0
                                          Тогда потребуется два игрока, один играет, а другой троллит ИИ в чате. В депрессию ИИ он конечно не вгонит, но возможно тот выболтает какую-нибудь информацию об своей базе/экономике (в общем а-ля «болтун — находка для шпиона»)
                          0
                          Этот ИИ не сильнейший, он просто заточен под эту игру. Он даже не сможет отличить собаку от ягуара на фотографии, с чем не очень хорошо, но справляются другие нейросети.
                          0
                          Зачем?
                          В любой игре, где требуется реакция и скорость клика, у машины автоматически появляется преимущество просто потому что у нее нет задержки.
                          Поэтому в реал-тайм играх не так приоритетно писать алгоритм, который думает над стратегией — зачем, если можно ВСЕГДА обыграть человека просто по скорости?
                            0
                            Верно сказано, что машина может обыграть человека по скорости. Но как быть с вариантом хитрить, сыграть в фаст-раш, пять дагонов, грамотный сплит-пуш и т.д. Я бы не сказал что в доте скорость решит все
                              0
                              зачем, если можно ВСЕГДА обыграть человека просто по скорости?

                              Чтобы обыграть человека с помощью суперскорости и сумасшедшего микро тоже нужны хорошие алгоритмы (по крайней мере в случае RTS). Ибо в противном случае мы бы видели как разработчики компьютерных игр разрешали бы компьютеру получать преимущество с помощью скорости. Но в реальности они просто программируют его на несколько шаблонов и дают тонны ресурсов. Ибо дать тонны ресурсов проще чем написать алгоритм эксплуатирующий параллелизм и суперскорость компа на полную катушку.
                                0
                                Вопрос в том, что если алгоритм начинает работать, человеку в принципе нечего этому противопоставить.
                                Таким образом, не появляется интерес сражаться с компьютером на равных. Каждый будет использовать свои алгоритмы, но при этому АИ будет продолжать учиться и перенимать у человека уже стратегические решения, а человек в принципе не способен освоить скорость кликов и реакцию на уровне компьютера.
                                  0
                                  Вопрос в том, что если алгоритм начинает работать, человеку в принципе нечего этому противопоставить.
                                  До этого «если» надо ещё дожить. До этого же момент алгоритм будет временами откровенно тупить и проигрывать людям несмотря на всю свою суперскорость и параллелизм. Достичь же момента когда компьютер научится на полную катушку использовать свои возможности дабы сокрушить человеков и есть challenge (хотя потом можно будет поднять планку и ввести ограничения, дабы показать что ИИ может победить людей чисто интеллектуально).

                                  Зачем?
                                  В любой игре, где требуется реакция и скорость клика, у машины автоматически появляется преимущество просто потому что у нее нет задержки.

                                  Ещё лично мне было бы интересно увидеть возникновение ассиметрии в игре вызванной разной природой игроков (в данном случае человек и машина). Какие чисто компьютерные (т.е. которые будет невозможно повторить игрокам-людям) стратегии возникнут в игре? Будут ли человеческие стратегии которые ИИ будет по каким-то причинам НЕспособен повторить? Смогут ли люди найти к ним контры и если да, то какие? Насколько сильно поломается игровой баланс который изначально расчитывался на игроков-людей и можно ли будет его поправить так, чтобы на равных могли играть и те и другие без ввода специальных ограничений для ИИ (вроде числа кликов в секунду)? Будут ли у ИИ специальные анти-человеческие (т.е. применяемые только против игроков-людей) стратегии? Будут ли у ИИ специальные стратегии применяемые только против других ИИ? Как игрок (человек или ИИ) будет определять против кого борется (человека или другого ИИ)? Как и те и другие будут пытаться выдать себя друг за друга (человек за ИИ, а ИИ за человека)? И как игроки будет бороться с попытками такого обмана? Возможна ли такая ситуация, что станет распространёной практика когда все игроки-люди с самого начала раскрываются что они люди и заключают между собой временный альянс против одного/двух ИИ?
                                    0
                                    Ну честно говоря не очень challenge. Этот Challenge очень зависит от игры.

                                    Вводить число кликов в секунду — не поможет.

                                    Везде где нужна точность и аккуратность, компьютер будет не просто кликать на максимальной скорости, а в принципе не будет промахиваться. У него не будет затекать рука, не будет случайных мисскликов, и клики будут не 10 раз в секунду, а в тот момент и тогда, когда это нужно.

                                    Поэтому просто нет смысла писать алгоритм для подобных игр — разработчики, заинтересованные в выиграше, будут больше уделять внимание этим фичам, как бы «грамотно начитить», чем над стратегией решений.
                            0
                            Следующий этап: когда человека обыграет система мощностью в 100Вт и конструктивным объёмом в пару литров :)
                              –1

                              интетересно, а рейтинг у этой системы бесконечность?

                                –2
                                Пусть попробует моего деда в переводного дурака обыграть.
                                  +1
                                  AlphaGo уходит из го

                                  Надоело ему с детьми в песочнице.

                                    0

                                    Ну чтож пошагово получилось, несомненно это серьзный результат но в переди новый рубеж SC2 в реальном времени.


                                    Уважаемые комментаторы заранее прошу не скидывать видео с автоматоном который нечеловечески микрит юнитов, тема с микро уже обсуждалась и не раз в комментах к альфаГО и это решаемый вопрос.

                                      0
                                      То есть добавить правило, ограничивающее кол-во полезных команд в секунду?
                                        +1

                                        Не полезных, а всех. Как узнать, что команда была полезной?

                                          0
                                          Зачем вообще что то ограничивать? Если человек в силу био причин не может что то делать то это его проблемы, пусть использует сильные стороны свои а не перекликает компьютер. Либо вообще менять правила игры как то, но имхо даже с текущими правилами повторить что на видео было не получится, так как часто танки тупо невидно что они стреляют, и не предугадать куда попадет снаряд. Но если после изобретения ии будет такая проблема, близарды выпустят патч и анимация выстрела и попадания будет одновременно, чтобы исключить такой абуз.
                                        +1
                                        отличные планы разработчиков.
                                        указать ИИ как распространяются болезни среди людей и слабости энергетической системы.
                                        ну и напоследок научить ее ведению войны.
                                        Все это напоминает мне историю Нобеля и Оппенгеймера, которые вовремя остановиться не успели опьяненные своими возможностями.
                                          0

                                          задержка была бы год или два…
                                          не они, так кто нибудь другой.
                                          Прогресс не остановить

                                            0
                                            Для начала, фраза «вся команда разработчиков всегда верила в то, что AlphaGo станет полезным для человечества» звучит, конечно, пафосно, но в ней упущен один момент — «полезным в игре го». Ничего другого эта программа не может в принципе. Ну и в целом в мире ИИ вроде прорывов она не сделала: reinforced learning и сверточные сети были вроде и до этого известны. Да, это крутое применение, но вокруг полно других примеров крутого применения НС.
                                            Ну и главное: не нужен никакой ИИ чтобы, например, эксплуатировать слабости энергетической системы. Если она и вправду настолько уязвима, то достаточно старого доброго вируса.
                                              0
                                              Очередной разговор о полезности полетов в космос 50 лет назад.
                                                0
                                                Знаете, это как сказать Дженнер никакого прорыва в медицине не сделал. И до него было общеизвестным фактом что если переболеть оспой, то второй раз не заболеешь.
                                              +1
                                              Сломали закон «всегда найдётся азиат, который может круче» =(
                                                0
                                                Надо пилить киборга-азиата.
                                                  +2
                                                  Уверены, что азиаты не смогут сделать копию AlphaGo, которая обыграет оригинал? В конце концов, сейчас самый мощный суперкомпьютер в мире именно у азиатов.
                                                    0

                                                    Уже сделали: FineArt компании Tencent. Но уровень игры пока ниже чем у AlphaGo — людям иногда проигрывает.

                                                  0
                                                  Правда, ему тоже удалось добиться победы в одном из пяти матчей.

                                                  В партии. А матч — это вся серия из 5 партий.
                                                    0
                                                    А если, допустим, компьютер будет управлять роем военных дронов и проведёт миллион-другой виртуальных боёв с самим собой, то правильно ли я понимаю, что через некоторое время не найдётся человека, который смог бы разбить этот рой?
                                                      0

                                                      Современные ИИ смогут победить только если человек будет играть по правилам. Например: не использовать постановщики помех, сети или веревки, подвешенные на дроны, какие-нибудь аэрозоли для блокирования камер и т.п.

                                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                    Самое читаемое