Есть ли шанс у AlphaGo в матче против Ли Седоля: мнения и оценки профессиональных игроков в го

    В марте состоится матч го-профессионала 9 дана и искусственного интеллекта компании Google


    Ни один компьютер пока не в состоянии обыграть профессионального игрока в азиатскую настольную игру го. Дело в особенностях игры: позиций слишком много, а интуицию человека сложно описать алгоритмически. Мир придерживался подобных мнений до 27 января. Несколько дней назад компания Google опубликовала данные исследования своего подразделения DeepMind. В нём рассказывается о системе AlphaGo, которая в октябре прошлого года смогла обыграть профессионального игрока второго дана Фань Хуэя в 5 играх из пяти.

    Тем не менее у профессиональных игроков и знакомых с го возникли вопросы по качеству игры. Хуэй — трёхкратный чемпион, но он чемпион Европы, где уровень игры не слишком высок. Вызывает вопросы не только выбор игрока для демонстрации силы AlphaGo, но и некоторые ходы в партиях.

    Алгоритм


    Го давно считается игрой, обучить в которую искусственный интеллект затруднительно из-за огромного пространства поиска и сложности выбора ходов. Го принадлежит к классу игр с совершенной информацией, то есть игроки знают обо всех ходах, которые ранее совершили другие игроки. Решение задачи поиска исхода игры связано с вычислениями функции оптимального значения в дереве поиска, содержащем приблизительно bd возможных ходов. Здесь b — это количество корректных ходов в каждой из позиций, а d — длина игры. Для шахмат эти значения составляют b ≈ 35 и d ≈ 80, и полный поиск не представляется возможным. Поэтому позиции фигур оцениваются, а потом оценка учитывается при поиске. В 1996 году компьютер впервые выиграл в шахматы у чемпиона, а с 2005 года ни один чемпион уже не в состоянии выиграть у компьютера.

    Для го b ≈ 250, d ≈ 150. Возможных позиций камней на стандартной доске более, чем в гугол (10100) раз больше, чем в шахматах. Число возможных позиций больше, чем атомов во Вселенной. Осложняет ситуацию то, что предсказать ценность состояний трудно из-за сложности игры. Два игрока размещают камни двух цветов на доске определённого размера, стандартное поле — это 19×19 линий. Правила варьируются деталями, но основная цель игры проста: нужно отгородить на доске камнями своего цвета территорию большего, чем соперник, размера.

    Существующие программы умеют играть в го на уровне любителей. Они используют поиск в дереве Монте-Карло для оценки ценности каждого состояния в дереве поиска. Также в программы заложены политики, которые предсказывают ходы сильных игроков.

    В последнее время глубинные свёрточные нейронные сети смогли добиться хороших результатов в распознавании лиц и классификации изображений. В Google ИИ даже самостоятельно научился играть в 49 старых игр Atari. В AlphaGo похожие нейросети истолковывают положение камней на доске, чем помогают оценить и выбрать ходы. В Google исследователи применили следующий подход: они использовали сети ценности (value networks) и сети политики (policy networks). Затем эти глубинные нейросети обучаются как на множестве партий людей, так и на игре против своих копий. Новым является также поиск, объединяющий метод Монте-Карло с сетями политики и ценности.


    Схема обучения нейросети и архитектура.

    Нейросети натренировывали в нескольких стадиях машинного обучения. Сначала проводилось контролируемое обучение сети политики прямо с помощью ходов игроков-людей. Другая сеть политики подвергалась обучению с подкреплением. Вторая играла с первой и оптимизировала её, чтобы политика сдвигалась к выигрышу, а не просто предсказаниям ходов. Наконец, проводилось обучение с подкреплением сети ценности, которая предсказывает победителя игр, в которые играют сети политики. Конечный результат — это AlphaGo, комбинация метода Монте-Карло и сетей политики и ценности. Был достигнут результат корректного предсказания следующего хода в 57 % случаев. До AlphaGo лучший результат составлял 44 %.

    В качестве входных данных для обучения использовались 160 тыс. игр с 29,4 млн позиций с сервера KGS. Брались партии игроков с шестого по девятый дан. Миллион позиций был выделен для тестов, а собственно обучение велось на 28,4 млн позиций.


    Сила и точность сетей политики и ценности.

    Для работы алгоритмов нужны на несколько порядков большие вычислительные мощности, чем при традиционном поиске. AlphaGo представляет из себя асинхронную многопоточную программу, которая выполняет симуляцию на ядрах центрального процессора и запускает сети политики и ценности на видеочипах. Финальная версия выглядела как 40-поточное приложение, запускаемое на 48 процессорах (вероятно, имелись в виду отдельные ядра или даже гиперпоточность) и 8 графических ускорителях. Также была создана распределённая версия AlphaGo, которая использует несколько машин, 40 потоков поиска, 1202 ядер и 176 видеоускорителей.

    Полностью с отчётом DeepMind можно ознакомиться в документе.


    Поиск Монте-Карло в AlphaGo.

    Для оценки способностей AlphaGo проводились внутренние матчи как против других версий программы, так и других подобных продуктов. В том числе сравнение велось с такими популярными коммерческими программами, как Crazy Stone и Zen, и сильнейшими открытыми проектами Pachi и Fuego. Все они основаны на высокопроизводительных алгоритмах метода Монте-Карло. Но также AlphaGo сравнили с немонтекарловской GnuGo. Программам отводилось по 5 секунд на ход. Проводилось сравнение как запускаемой на одной машине AlphaGo, так и распределённой версии алгоритма.

    Как заявляют разработчики, результаты показали, что AlphaGo на много данов сильнее любых предыдущих го-программ. AlphaGo выиграла 494 из 495 игр, то есть 99,8 % матчей против других подобных продуктов. Правила го допускают фору, гандикап: на поле можно установить до 9 чёрных камней до хода белых. Но даже с 4 камнями форы одномашинная AlphaGo выигрывала в 77 %, 86 % и 99 % случаев против Crazy Stone, Zen и Pachi, соответственно. Распределённая версия AlphaGo была значительно сильнее: в 77 % игр она побеждала одномашинную версию и в 100 % игр — все остальные программы.


    AlphaGo против других программ.

    Наконец, созданный продукт сравнили с человеком. Против распределённой версии AlphaGo сразился профессиональный игрок 2 дана, победитель Чемпионата Европы по го в 2013, 2014 и 2015 годах Фань Хуэй. Игры проводились при участии судьи из Британской федерации го и редактора журнала Nature. Было проведено 5 игр в период с 5 по 9 октября 2015 года. Все из них выиграл алгоритм разработки Google DeepMind. Именно эти игры стали поводом к заявлению, что компьютер впервые смог обыграть профессионального игрока в го. Кроме 5 официальных партий были проведены 5 неофициальных, которые не шли в зачёт. Две из них Фань выиграл.

    Доступны записи ходов пяти игр, просмотр в веб-виджете и ролики на YouTube.

    Критика от профессиональных игроков


    Сомнению подвергается выбор профессионального игрока и слабая игра чемпиона. Также неясны выбранные правила: час на партию вместо нескольких часов серьёзных игр. Впрочем, формат выбирал сам Хуэй. В марте AlphaGo будет играть против Ли Седоля. Сможет ли алгоритм обыграть корейского профессионала девятого дана, считающегося одним из лучших игроков в мире? На кону миллион долларов. В случае победы человека его получит Ли Седоль, в случае победы алгоритма он уйдёт на благотворительность.

    Исследователи заявляют, что во время октябрьского сражения с человеком система AlphaGo рассматривала в тысячи раз меньше позиций, чем Deep Blue во время исторического матча с Каспаровым. Вместо этого программа использовала сеть политики для более умного выбора и сеть ценности для более точной оценки позиций. Возможно, подобный подход ближе к тому, как играют люди, говорят исследователи. Кроме того, система оценки Deep Blue была запрограммирована вручную, в то время как нейросети AlphaGo натренированы прямо из партий игры с помощью универсальных алгоритмов контролируемого обучения и обучения с подкреплением.


    Ли Седоль попробует свои силы против AlphaGo в марте.

    Профессиональные игроки высказывают различные точки зрения. Кому-то кажется, что Google специально выбрала не слишком сильного игрока, кто-то уверен, что Седоль проиграет уже в этом марте.

    Один из сильнейших англоговорящих профессиональных игроков в го Ким Менгван (девятый дан) считает, что Фань Хуэй играл не в полную силу. На 51-ой минуте видеоролика он приводит конкретный пример из второй партии. Возможно, Фань играл как с более слабым, чтобы проверить силу компьютера, говорит Ким. Менгван признал, что AlphaGo — шокирующе сильная программа, но она вряд ли сможет победить Ли Седоля.



    Судья матча Тоби Мэннинг рассказал в издании British Go Journal о матче. Он провёл анализ всех пяти игр и выделил некоторые моменты. Во второй, третьей и четвёртой партиях AlphaGo допускала ошибки, но Фань не воспользовался ими. Трёхкратный чемпион Европы отвечал собственными. Статья в журнале заканчивается общей положительной оценкой AlphaGo: программа сильна, но неясно, насколько.

    Также при подготовке материала я получил комментарии от российских профессионалов и любителей го. Александр Динерштейн (Казань), третий дан (профессиональный), семикратный чемпион Европы:

    В матчах с Каспаровым над дебютом программы Deep Blue работала целая группа сильных гроссмейстеров. Возможно, что и к матчу с Ли Седолем такая команда будет собрана, но по матчу с Фань видно, что работа в этом направлении не велась в принципе. Сильнейший игрок в го из команды Google играет в силу пятого любительского дана. Это уровень четырёх камней форы с Ли Седолем.

    Во всех партиях с Фань программа играла в точку 4-4 (хоси по-японски, starpoint на английском). Кроме нее есть много других возможных начал. Из распространенных: 3-3, 3-4, 5-3, плюс есть разные нестандартные дебюты, где первым ходом играют, к примеру, в центр доски. С точки зрения дебютных новинок, программа не показала ничего нового. В этом отношении она играла очень примитивно.

    Дебюты, которые применял Фань, просто были забиты в ее базу. Ничего нестандартного он не использовал. Для меня это остается большим вопросом – как будет действовать программа, если с первых же ходов свернуть с дебютных справочников. На пустой доске вариантов столько, что никаким методом Монте-Карло их не просчитать. В этом го выгодно отличается от шахмат. В шахматах всё давно изучено на глубину 20-30 ходов, а в го, при желании, уже первым ходом можно создать позицию, которая не встречалось в истории профессионального го. Программе придется играть самостоятельно, а не вытаскивать варианты из базы знаний. Посмотрим, сможет ли она это сделать. Я в этом сильно сомневаюсь и ставлю на Ли Седоля.

    Кстати, в Санкт-Петербурге летом 2016 года должен состояться Чемпионат Европы по го (EGC), в рамках которого всегда проходит турнир компьютерных программ. «Российская федерация го» пригласила к участию в турнире все сильнейшие программы. Если они примут приглашение, то возможно, именно на этом турнире впервые сыграют между собой программы Google и Facebook. Последняя, в отличие от своего конкурента, идёт честным путем. Бот DarkForest играет тысячи партий на сервере KGS. Сильнейшая версия приближается к шестому дану на сервере. Это очень неплохой уровень. Фань Хуэй и игроки его уровня – это примерно восьмой дан на сервере (из девяти возможных). Разница составляет примерно два камня форы. При такой разнице программа действительно может иногда обыгрывать человека. Если на равных – то примерно в одной партии из десяти.

    Максим Подоляк, (Санкт-Петербург), вице-президент «Российской федерации го»:

    Мне трудно поверить в то, что крупнейший разработчик ПО приступает к решению сложнейшей, а вообще говоря, неразрешимой, задачи, никак не освещает свою работу, не показывает промежуточные результаты, успешные или нет, и сразу достигает грандиознейшего успеха. Скорее я поверю в то, что Google разработал прекрасный рекламный ход: нашёл не самого сильного игрока с профессиональным статусом и чемпионским титулом, который на некоторых условиях согласится не очень убедительно сыграть. Вот это очень похоже на мир, который я знаю. Простое и понятное решение: никаких рисков, никакого судебного преследования за обман, никаких последствий, только сравнительно небольшой гонорар живому участнику. А плюсы настолько велики, что трудно представить: главный конкурент отправлен в нокаут, весь мир гремит о грандиозном успехе и невиданном прорыве. Google может всё. Даже если позже обман и вскроется, то этого никто не заметит. Да и кто его вскроет? Кто проверит качество теста?

    Александр Крайнов (Москва), любитель игры го:

    Я, в силу профессиональной деятельности, довольно хорошо знаю ситуацию «с той стороны».

    В 2012 году в области машинного обучения в целом произошел качественный скачок. Количество данных для обучения, уровень алгоритмов и мощности для обучения вышли на такой уровень, что искусственные нейронные сети (разработанные как принцип довольно давно) стали давать фантастические результаты.

    Принципиальное отличие обучения на нейронных сетях заключается в том, что им не надо давать на вход факторы (в случае го, объяснять, например, какие формы являются хорошими). Им в пределе даже правила можно не объяснять. Главное дать большое количество положительных (ходы выигрышной стороны) и отрицательных (ходы проигравшей стороны) примеров. И сеть научится сама.

    Как только алгоритм выходит на высокий уровень игры, программа может играть сама с собой огромное количество партий, обучаясь на результате. Причем не обязательно партии доигрывать. Можно делать так: берётся любая позиция, сеть предсказывает несколько хороших ходов, ходы просчитываются (используя традиционные алгоритмы перебора по дереву решений) насколько возможно, результат добавляется в обучающую выборку.

    Я бы не рекомендовал делать ставки на Седоля, ориентируясь на игру программы с Фань.

    Мы, грубо говоря, наблюдая за игрой программы, наблюдаем за игрой талантливого четырёхлетнего ребенка. К моменту игры с Седолем в марте он может сильно прибавить. Нейросетевые модели сейчас очень быстро обучаются при достаточном количестве данных. А в случае с го данных очень много. Плюс, как я сказал раньше, их можно генерировать.

    Что говорит сам Ли Седоль


    Профессиональные игроки го соревнуются не за звание чемпиона мира, а за титулы. Признание и статус мастера определяются количеством титулов, которое он смог получить в течение года. Ли Седоль входит в пятёрку сильнейших игроков го в мире, и в марте этого года ему предстоит побороться с системой AlphaGo.

    Сам корейский чемпион предсказывает, что он выиграет со счётом 4-1 или 5-0. Но уже через 2—3 года Google захочет взять реванш, и вот тогда игра с обновлённой версией AlphaGo будет интересней, считает Ли.



    Задача создания подобного алгоритма ставит новые вопросы о том, что такое обучение и мышление. Как напоминает М. Емельянов, третья сверху ступень мастерства (пин) по древней китайской классификации называется «полная ясность». Подобный уровень игры предполагает, что решения принимаются интуитивно, практически не считая варианты. Один из сильнейших мастеров XX века Го Сэйгэн говорил, что ему казалось, что он бы выиграл у «го-бога», взяв два или три камня форы. Сэйгэн считал, что почти дошёл до предела понимания игры. Сможет ли нейросеть достичь подобного? Быть может, человеческая интуиция — это заложенный природой алгоритм?

    Автор благодарит Александра Динерштейна и паблик go_secrets за комментарии и помощь в оформлении публикации.
    Поделиться публикацией
    Ой, у вас баннер убежал!

    Ну. И что?
    Реклама
    Комментарии 61
    • 0
      Го принадлежит к классу игр с совершенной информацией, то есть игроки знают обо всех ходах, которые ранее совершили другие игроки.
      Кто-нибудь умеющий играть, подскажите, пожалуйста, действительно ли игроки запоминают все ходы сделанные за игру? Кажется невероятной способностью.
      • +1
        Да, только в этом нет ничего особенного, любой профессиональный игрок должен уметь восстановить ход игры. У каждого совершенного хода есть своя логика, на ее основе партия и запоминается. Ну и ко всему прочему есть типичные взаимовыгодные розыгрыши, называемые «Дзёсеки».
        • +5
          Да, это приходит само. Турнирные партии с большим контролем запоминаются довольно просто, т.к. над некоторыми ходами иногда думаешь несколько минут, а потом идет весьма логичное развитие. Хотя, далеко не факт, что партия вспомнится через месяц, но в течении дня восстановить игру вполне возможно, даже для такого не очень сильного игрока как я (1800 очков рейтинга РФГ ~ 1 разряд).
          Сумбурные игры с нетривиальной логикой и блицы запоминаются хуже, но прямо после игры их тоже можно восстановить в памяти, хотя, скажу по себе, не уверен, что до конца смогу вспомнить такую игру, но смогу восстановить больше половины ходов.
          Начинающим иногда рекомендуют учить партии профессионалов, чтобы запомнить основные шаблоны и формы.
          • 0
            Сильные игроки помнят все свои партии. И могут их восстановить даже через годы. Даже легкие партии сыгранные вчера за 15 они могут восстановить.
          • 0
            А еще есть такая байка. В каком-то лохматом году, один наш чемпион поехал на чемпионат мира среди любителей. От Китая там играл совсем молодой представитель. Партию они не записывали. После игры его попросили записать партию. Так вот он стал ее записывать буквально по строчкам доски слева направо и сверху вниз. Если представить доску, то он писал буквально так: белые-ход134, черные-ход45, черные-ход55 и так далее. Это для нас даже уму не постижимо. А то тут развели: нейросети, нейрости ))
            • –1
              Мне думается, имеется ввиду просто полная открытость информации по игре.
              Есть поле, есть фишки, все ходы отображены на поле, всё открыто, информация полна и доступна сразу. В Го порядок ходов не важен. Как и в шахматах. Текущее состояние полно.
              • +2
                Порядок ходов не важен? ) Вы только это игрокам в Го не говорите, а то как-то неудобно потом будет перед ними )
                • +1
                  Какое значение для игры на ходу N, с известным текущим состоянием фишек на поле, имеет ход N-1?
                  • 0
                    Без знания предыдущих ходов нельзя предсказать поведение противника. Как и в шахматах.
                    • 0
                      Это всего лишь особенность человеков: им свойственно «прилипать» к локальной ситуации и не видеть более важных ходов. Сильному игроку предыдущие ходы и вправду не важны.
                    • 0
                      Как бы покороче ответить… Тут надо хотя бы поиграть в Го некоторое время.
                      Смотря где этот ход N-1 сделан. То есть это будет уже совсем другая партия.
                      Достаточно во время игры выставить камни в том же порядке, но не в той последовательности, и это уже совсем другая партия с другим исходом.
                      • +3
                        Видимо вы не знакомы с теорией игр. Для человека — да, порядок важен. Но если мы не пытаемся предсказать действие соперника, на основе предыдущего хода, то порядок не важен.
                        • +4
                          Если подходить формально, то порядок важен только для проверки ограничений связанных с ко/супер-ко. Имея на руках текущее состояние игры, нам необязательно знать, как оно достигнуто. Подавляющее большинство задачек по го имеют вид: дано следующее положение камней, ходят чёрные/белые. Порядок важен с точки зрения получения, удержания инициативы. Но речь в данном случае идёт о планировании будущих ходов, а не о уже сделанных.
                        • 0
                          Например ко-борьба. И допустимо ли сейчас его пробить или надо сначала нанести угрозу.
                  • +2
                    gogameguru.com
                    Тут можно почитать новости и посмотреть разбор партии профессионалом.
                    Так же там есть разборы партий между профи. Таких грубых ошибок как в партии Фана и AlphaGo нет. И часто одна микроскопическая ошибка решает партию. Кто-то захватывает преимущество и не отдает в течении всей последующей игры.(Этим особенно молодые китайцы славятся.)
                    Если программа будет играть так же как с Фаном у нее нет ни одного шанса даже партию зацепить у Ли Седоля. Другой овпрос насколько она будет лчше играть к марту.
                    • +2
                      остается большим вопросом – как будет действовать программа, если с первых же ходов свернуть с дебютных справочников.

                      Нестандартные варианты дебютов вполне могли присутствовать при обучении сети, например при игре программы с самой собой. Так что на необычное фусеки я бы в подобной игре не полагался, но с удовольствием поглядел бы на поведение программы в такой ситуации. По крайней мере, судя по второй партии с Фанем, AlphaGo вполне может при таком раскладе существенно осложнить позицию и завязать жёсткую борьбу, требующую от человека большого внимания, аккуратности, расчёта и не прощающую ошибок.
                      • +1
                        Ли Седоль вряд ли будет играть что-то уж совсем необычное. Если только поймет что при обычном фусеки шансов выиграть нет т надо пробовать что-то другое.
                        • +2
                          В качестве «чего-то другого» вполне может выступить ко-борьба, кстати, отсутствовавшая в партиях с Фанем.
                        • 0
                          Да какую борьбу? ) То что было представлено в партиях с Фаном, там даже намека нет на борьбу. Самое сложное в партиях — это ко-борьба. А Ли Седоль очень силен в ко-борьбе. Можно сказать, что он один из лучших по этой части. Очень сложно оценить последствия ко-борьбы на профессиональном уровне. Не все профессионалы это могут.
                          • 0
                            Все эти хитрые нейросети очень хорошо реализуют одну из частей го — умение находить хорошие места для следующего хода (т.н. «большие ходы»). Однако вторая часть игры — решение тсумего — нейросетям пока что не под силу, на что указывают сами авторы. Поэтому если Ли Седол превратит всё в несколько запутанных взаимосвязанных тсумего, чем он вообщем то и любит заниматься, то нейросеть по идее будет чуть чуть промахиваться с ходами, а для тсумего это критично.
                            • 0
                              Ну вообще задачи на жизнь и смерть программы решать довольно хорошо умеют. Их же можно решить просто перебором всех возможныз комбинаций, начиная с точек формы. И в партиях с Фаном были такие примеры.
                        • +3
                          За статью спасибо, но вы бы терминологию причесали. А то от «игр с совершенной информацией» и «свертовых сетей» плакать хочется.
                          • +1
                            «Игра с совершенной информацией» вроде бы вполне устоявшийся термин из теории игр.
                            • +1
                              Насколько я помню, всегда говорили об играх с «полной» и «неполной» информацией. Поправьте меня пожалуйста, если я не прав.
                              • +2
                                Да, это правильное деление. Но игры с полной информацией дальше делятся на игры с совершенной и несовершенной информацией. Полная информация – знание правил игры и функций выигрыша всех игроков; совершенная информация – знание ещё и всех предыдущих ходов противника, или, иными словами, истории игры.
                                • 0
                                  Спасибо за информацию, теперь понятно.
                            • +1
                              «Свёртовые» исправил, спасибо.
                            • 0
                              Прошу интересующихся подсказать, а какая сейчас ситуация в шахматах?
                              На каком уровне играют лучшие программы? Есть ли турнииры против человека?
                              • +1
                                Посмотрите здесь и здесь.
                                А если в двух словах, то компьютеры в шахматах сейчас намного сильнее людей.
                                • +1
                                  Турниров людей и компьютеров нет: у людей шансы минимальные. Рейтинг чемпиона мира Карлсена — 2844, 45 человек имеют 2700 и выше (звание гроссмейстера могут присвоить при не менее 2500), а лучшие шахматные движки оцениваются на 3200-3350.
                                  • +2
                                    «В 1996 году компьютер впервые выиграл в шахматы у чемпиона, а с 2005 года ни один чемпион уже не в состоянии выиграть у компьютера.»
                                    Сейчас шахматисты используют компьютерные шахматы для анализа партий и тд
                                    • +1
                                      Человек может играть с компьютером только с форой. Даже топам программа не проигрывает без пешки.
                                    • 0
                                      Программа от google чисто программная разработка. Т.е. её можно скопировать?
                                      Как сильно возрастут её возможности ести увеличить производительность железа на 1-2 порядка.
                                      Предположим запустить на 1 из топ 5 супер компьютеров предварительно оптимизировав?
                                      Вопрос по нейросетям:
                                      Если взять 1 программу и скопировать её, сделать 4 копии и заставить из играть друг с другом то через 10000 игр они перестанут быть идентичными? и как сильно они изменяться?
                                      И будут ли отличаться 2 идентичные нейросети обученные на одинаковой выборке изображений если перед обучение они были идентичны?
                                      • 0
                                        Если взять 1 программу и скопировать её, сделать 4 копии и заставить из играть друг с другом то через 10000 игр они перестанут быть идентичными?
                                        Зависит от метода обучения (см. ответ на второй вопрос ниже).
                                        Чтобы были точно разные, лучше заставлять их попарно играть друг с другом по N партий, а потом менять пары и снова играть, пока каждая не сыграет «10000 игр».

                                        И будут ли отличаться 2 идентичные нейросети обученные на одинаковой выборке изображений если перед обучение они были идентичны?
                                        Зависит от метода обучения (оценки параметров) -> инициализация начальных параметров, глобальная (не)сходимость метода, кол-во итераций.
                                        Данная НС, считаю, что не будет различаться. Чтобы были разные, нужно на разных наборах данных обучать.
                                      • +2
                                        В статье не указано, что играла распределенная версия (1202 CPU и 176 GPU). Кроме того, было еще 5 партий с более коротким контролем, из которых 2 выиграл человек (в отличии от шахмат, где чем короче контроль, тем выше преимущество (и так огромное) машины над человеком). Если с Седолем будут играть с контролем 4-6 часов, то это усилит программу.

                                        Кроме того, у топовой программы Crazy Stone нераспределенная версия выиграла 77% игр с гандикапом в 4 камня, то есть усиление огромное. Так что в теории заговора я не верю.
                                        • 0
                                          Всё, что вы перечислили, в статье есть:
                                          Против распределённой версии AlphaGo сразился профессиональный игрок 2 дана, победитель Чемпионата Европы по го в 2013, 2014 и 2015 года Фань Хуэй.
                                          Именно эти игры стали поводом к заявлению, что компьютер впервые смог обыграть профессионального игрока в го. Кроме 5 официальных партий были проведены 5 неофициальных, которые не шли в зачёт. Две из них Фань выиграл.
                                          Также неясны выбранные правила: час на партию вместо нескольких часов серьёзных игр. Впрочем, формат выбирал сам Хуэй.
                                          Но даже с 4 камнями форы одномашинная AlphaGo выигрывала в 77 %, 86 % и 99 % случаев против Crazy Stone, Zen и Pachi, соответственно.
                                          • 0
                                            Дьявол как всегда, в деталях: количество CPU дает примерное представление о вычислительной мощности соперника Фань Хуэйа. Про неофициальные партии важно то, что контроль был короче, что позволяет предположить, что на турнирном контроле AlphaGo будет ещё сильнее.

                                            Но признаю, что статью читал по диагонали, потому что это уже четвертая статья на эту тему (пожалуй самая подробная). Так что некоторые вещи я и правда просто не заметил.
                                          • 0
                                            А гле можно посмотреть партии против других программ? Тот же zen например играет на KGS и кстати недавно в блице(10 секунд на ход) обыграл Павла Лисего — европейского про.
                                            Фань играл очень слабо даже для своего уровня. ОН допускал очень грубые ошибки и не наказывал Альфу за грубые ошибки. Следствие чего это — денег, плохой формы или еще чего каждый решает сам.
                                            Программа использовала меньше времени чем Фань, насколько я знаю, так что больший контроль скорее на руку человеку. Другой вопрос, что есть мнение что не для про больше полутора часов времени просто не нужно, так как оно будет просто лишним. А вот про намного более полезно расходуют время.(Я не считаю Фаня про по силе игры, так как он уже давно не играет в про турнирах постоянно и намного больше играет с европейскими любителями, что не могло сказаться на его уровне.)
                                          • +1
                                            В шахматы давно играю на сайтах www.iccf.com и www.bestlogic.ru

                                            Давно хочу попробовать играть в ГО. Подскажите пожалуйста:
                                            — на каких сайтах можно = лучше начать играть в ГО?
                                            — какие программы можно использовать для игры в ГО с движком = программой?
                                            • 0
                                              Один из самых популярных сайтов в России это www.gokgs.com. На нем некоторые клубы проводят семинары, можно договориться об обучающих партиях, поиграть с ботами, посмотреть за чужими играми, удобно проводить разборы партий. Из ботов для начала неплохо пойдет что нибудь на основе движка GnuGo. На том же kgs можно поиграть с ботами с рейтингами 30-25кю, а потом и дальше если будет слишком легко (рейтинги на этом сервере начинаются с 30кю для новичков до 1кю, потом начиная с 1 дана и вверх). Разница в 1кю примерно соответствует одному камню форы (если играть черными) или 7-8 очкам коми (для белых).
                                              • 0
                                                P.s.: видимо, все же, не стоит с аккаунтом r&c делать первые комментарии в теме с недосыпа, потому что можно наделать кучу явных грамматических ошибок, с невозможностью их исправить, хотя я их и заметил почти сразу.
                                                • 0
                                                  Поиграть против программы можно очень хорошо на планшете — под Андроид очень много вариантов уже есть.
                                                  • 0
                                                    Гораздо лучше играть с людьми. И для новичка с обязательным разбором партий.
                                                • +1
                                                  online-go.com/play — не нужны ни флеш ни java
                                                  pandanet-igs.com/communities/pandanet — есть клиенты под Android/Ios

                                                  Рейтинги на этих сайтах работают почти так же как на kgs, то есть два игрока с одинаковым рейтингом на разных сайтах играют примерно в одну силу (ну может плюс-минус кю). Игрой с ботами лучше особо не увлекайтесь, особенно поначалу, они играют довольно шаблонно.

                                                  Еще до кучи:

                                                  playgo.to/iwtg/en — объяснение правил для людей, которые никогда не играли в го, с интерактивными примерами
                                                  senseis.xmp.net — обо всем
                                                  www.goproblems.com — задачи
                                                  • +1
                                                    Новичкам лучше не играт с ботами. Из-за того, что слабые боты очень сильно тупят и делают очень глупые ходы, которые не делает даже человек такого же уровня, можно криво обучиться. Зато они правда считают хорошо локальные ситуации.
                                                    • 0
                                                      Для разнообразия мнений скажу, что сам начинал играть с gnugo: 1.5 года назад начал с «ёмоё! этот камень исчез!», после где то 1000 партий я мог захватить у gnugo всю доску 9x9, сейчас продвигаюсь к 2-му дану на КГС. Имхо, главный плюс бота в том, что с ним можно играть когда удобно, а противника ещё найти надо. Насчёт того, что боты хорошо считают локальный ситуации (тсумего) не соглашусь — они делают вид, что считают, но если правильно ходить, то они продолжат делать вид что что то там захватывают даже когда понятно, что ход бота можно проигнорировать. Если вдруг сделают хорошую решалку локальных ситуаций и прикрутят это к нейросети (которая ищет большие ходы), то Ли Седолу придётся туго.
                                                      • 0
                                                        Gnu Go, как раз, плохой пример. Играет очень однообразно. Тоже играл с ним, будучи новичком. После пары-тройки партий выиграть не составляет труда, так как появляется знание о его слабых сторонах. В последних версиях реализовали тот же Monte Carlo Tree Search, но только на доске 9x9, на большой доске всё по прежнему. Из руководства пользователя Gnu Go (http://www.gnu.org/software/gnugo/gnugo_3.html):
                                                        GNU Go can play Monte Carlo Go on a 9x9 board. (Not available for larger boards.)
                                                  • 0
                                                    Спасибо, попробую.
                                                    В шахматах уже прошел чемпионат мира между командами шахматных серверов.
                                                    www.chess-server.net/uploads/wccstc/index.html
                                                    • +2
                                                      > В случае победы человека его получит Ли Седоль, в случае победы алгоритма он уйдёт на благотворительность.

                                                      Думаю, если бы мы могли поинтересоваться в этом вопросе мнением самого AlphaGo, то он бы выбрал купить на него себе еще процессоров ;)
                                                      • +1
                                                        Вспоминается незабвенное
                                                        • 0
                                                          А мне сразу этот рассказ теперь вспоминается: geektimes.ru/post/269848/#comment_8960854
                                                          Там когда разработчик игрового ИИ решил узнать у самого ИИ, что тому нужно для более эффективного выполнения поставленной задачи первым было — хочу еще процессоров(серверов)!
                                                          Получив которые следующим «желанием» было — загрузи мне книги и другие материалы по архитектуре процессоров на которых я работаю, мне кажется они очень неэффективны…
                                                        • 0
                                                          Кстати занимая углы АльфаГо только в одном случае из 10 занаяла не пункт 4-4. Считается что при розыгрыше с этими пунктами позиция более проще. Интересно программа сама выбирает эти пункты для начала пратии или это выбор людей.
                                                          • 0
                                                            Кстати, а напомните, кто в курсе, когда компьютер впервые смог обыграть в матче профессионального сильного шахматиста? где-то в 80-х наверно?
                                                            • 0
                                                              Пожалуйста, читайте статьи перед комментированием.
                                                              В 1996 году компьютер впервые выиграл в шахматы у чемпиона, а с 2005 года ни один чемпион уже не в состоянии выиграть у компьютера.
                                                              ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D1%8B%D0%B5_%D1%88%D0%B0%D1%85%D0%BC%D0%B0%D1%82%D1%8B
                                                              • 0
                                                                пожалуйста, читайте вопрос перед ответом.
                                                                речь не о чемпионе мира
                                                                • 0
                                                                  Ну тогда в нём смысла мало, поскольку игроки бывают очень разные. В 1967 году, Mac Hack VI против неназываемого игрока с рейтингом 1510 по шкале USCF. Или 1977 год, Чарльз Феннер против Chess 4.5.
                                                                  • 0
                                                                    мда, ну можно уточнить, уровня в шахматах, приблизительно сравнимого с уровнем побитого Фань Хуэя в го.
                                                                    On May 6, 1978, Chess 4.6 defeated U.S. chess champion Walter Browne (2560) at a 44-board simultaneous exhibition in Minneapolis.
                                                                    — вот это бы подошло, если бы речь шла не об одной партии, а о матче…
                                                                    • 0
                                                                      Это была игра в сеансе одновременной игры, где одним из соперников гроссмейсера был компьютер.
                                                              • 0
                                                                Обычно компьютеры играли в турнирах со смешанным составом. Профи стали играть матчи только тогда, когда компьютеры набрали достаточную силу, т.е. где-то в конце 90-х. Так что победа Дип Блю над Каспаровым по сути и была первой победой над профессиональным шахматистом в матче.

                                                                Если придерживаться чуть менее строгих критериев, то можно все же выделить некоторые матчи состоявшиеся раньше (пишу примерно, по памяти):
                                                                1989 — Дип Сот победил в матче международного мастера Девида Леви (рейтинг на тот момент около 2300) со счетом 4:0.
                                                                1989 — Ничья 2:2 Дип Сот с гроссмейстером Робертом Бирном (ок. 2400)
                                                                1990 — Дип Сот играет вничью 1:1 с гроссмейстером Хельмутом Пфлегером.
                                                                1992 — Гроссмейстер Давид Бронштейн проигрывает товарищеский матч Дип Сот в быстрые шахматы. Но матч проводился в достаточно неформальной обстановке.
                                                                1993 — Дип Сот выигрывает у сборной Дании, состоявшей из гроссмейстеров и международных мастеров.
                                                                1994 — Каспаров проигрывает программе Чесс Гениус 1,5:0,5 в быстрые шахматы на Интел Гран При в Лондоне

                                                                • 0
                                                                  1993 — Победа Дип Сот над гроссмейстером Юдит Полгар в быстрые шахматы. Счет матча 1,5:0,5
                                                              • 0
                                                                Немного оффтопа: сейчас в Санкт-петербурге проходит чемпионат среди европейских про, и в данный момент идет трансляция партии Ильи Шикшина против Фан Хуэя. оба неоднократные европейские чемпионы.
                                                                Желающие могут посмотреть на youtube или на сервере KGS.

                                                                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                Самое читаемое