Вчера в Сеуле в гостинице Four Seasons прошла последняя пятая игра матча го. Каждая из них целую неделю плотно освещалась на Geektimes. В серии кто-то победил, но вряд ли подобное заинтересовало бы посетителя русскоязычного сайта о высоких технологиях и науке, если бы не один факт.
Играл Ли Седоль, обладатель девятого профессионального дана, один из лучших мастеров го в мире. Его оппонентом стала система компьютерного го AlphaGo, разработка Google DeepMind. До начала матча считалось, что ни один продукт не способен обыграть мастера высокого уровня. Но ИИ одержал победу со счётом 4:1.
Интересна скорость, с которой AlphaGo отточила го. Ещё в прошлом октябре системе для показательного матча скормили игрока куда слабее. Спустя пять месяцев она обходит одного из лучших. Похоже, что мы достигли 1997 года в шахматах, когда компьютер впервые обыграл действующего чемпиона в матче. С того момента шахматные программы улучшили навыки до такого уровня, что человек больше не способен выиграть у них в нормальных условиях.
Ожидает ли подобное го? Стоит ли бояться силы искусственного интеллекта? Мне удалось получить комментарии и ответы, которые предоставили вице-президент «Российской федерации го» и президент «Спортивной федерации го Санкт-Петербурга» Максим Подоляк, профессиональные игроки в го и многократные чемпионы Европы Илья Шикшин (первый профессиональный дан) и Александр Динерштейн (третий профессиональный дан).
Эту победу можно сравнить с другим историческим матчем. В 1997 году суперкомпьютер Deep Blue впервые в мире обыграл в матче действующего шахматного чемпиона мира. Проигрыш Каспарова не стал последним поражением людей. В последующие годы компьютерные -шахматы достигли точки, когда даже сильнейшие из шахматистов не могут обыграть их в нормальных условиях.
Го (бадук, вэйци) — настольная игра, которая зародилась в Древнем Китае и получила значительную популярность в Южной Корее, Китае и Японии. Сегодня в го играют около 60 миллионов людей. Игроки размещают на доске определённого размера камни двух цветов. Целью является отгородить на доске область большего, чем оппонент, размера.
Президент Международной шахматной федерации не без удовольствия говорит о том, что теперь участь шахмат ждёт и го.
С точки зрения создания ИИ, го при внешней простоте в разы сложнее шахмат — в гугол (10100) раз, если точнее. Именно в столько раз больше возможных позиций камней на стандартной доске 19×19, чем в шахматах. До появления AlphaGo считалось, что пока что любые программы играют на уровне любителей, и до уровня мастеров им ещё десятилетие.
Размер доски — далеко не единственное препятствие. Неприменимы многие алгоритмы, которые использовались для шахмат. Количество ходов больше, чем в шахматах. Игра начинается с 55 возможных ходов, а вскоре нужно учитывать почти все из 361 точек на доске. Какие-то из ходов популярней, какие-то почти никогда не используются. Начальные ходы партии — фусэки — быстро начинают уходить во что-то оригинальное. В шахматах фигуры убывают с доски, в го они добавляются (пусть и возможно удаление путём захвата камней). Это исключает создание базы окончаний партий. Существующие системы плохо справляются с окончанием игры, в том числе это случается из-за ко-борьбы.
Системы компьютерного го всё же существуют. Чаще всего подобные продукты оценивают ходы с помощью поиска по дереву или метода Монте-Карло, задействуют экспертные системы с базой хороших ходов, сопоставление с образцом и машинное обучение. Такие продукты как Crazy Stone, Zen или GnuGo могут показать неплохой результат, но они всё равно проигрывают профессионалам.
В 1989 году Goliath не смогла выиграть у любительского шестого дана с огромной форой в 17 камней. До AlphaGo высшим достижением считался выигрыш при 4 камнях форы. В этом году ждали снижения до 3 камней форы. Но вдруг появилась система, которая на равных «всухую» выигрывает у чемпионов.
Возраст: менее 2 лет
Страна: Великобритания
Дан: ?
В 2014 году Google купила DeepMind, британскую компанию по разработкам искусственного интеллекта. Именно DeepMind в прошлом привлекла внимание созданием искусственного интеллекта DQN, который самостоятельно научился играть в 49 старых игр Atari. При описании другого продукта компании — AlphaGo — тоже можно употребить слово «самостоятельно».
Эта система компьютерного го упрощённо состоит из комбинации метода Монте-Карло и нейросетей политики (policy networks) и ценности (value networks). Нейросети натренировывали в нескольких стадиях машинного обучения с помощью 160 тыс. партий с 28,4 млн позиций с сервера KGS игроков с шестого по девятый дан. Ещё миллион позиций был выделен для тестов. Сначала проводилось контролируемое обучение сети политики прямо с помощью ходов игроков-людей. Другая сеть политики подвергалась обучению с подкреплением. Вторая играла с первой и оптимизировала её, чтобы политика сдвигалась к выигрышу, а не просто предсказаниям ходов. Наконец, проводилось обучение с подкреплением сети ценности, которая предсказывает победителя игр, в которые играют сети политики. Был достигнут результат корректного предсказания следующего хода в 57 % случаев. До AlphaGo лучший результат составлял 44 %.
Подробнее технические составляющие рассматривались как на «Гиктаймсе», так и на «Хабре».
AlphaGo сравнивали с другими программами — она почти всегда обыгрывает любых конкурентов — и игроком-человеком. Для этого при участии судьи из «Британской федерации го» был организован матч против трёхкратного европейского чемпиона и обладателя второго профессионального дана Фань Хуэя. Все пять игр Хуэй проиграл.
Возраст: 33 года
Страна: Южная Корея
Дан: 9 профессиональный
Другой участник матча — профессиональный игрок в го Ли Седоль. Свой первый профессиональный дан Седоль получил в 1996 году в возрасте 13 лет. Седоль имеет 18 международных титулов, он входит в пятёрку сильнейших игроков мира.
AlphaGo обыграла чемпиона Европы, где уровень владения го ниже. При этом ошибки делали как программа, так и Хуэй. Неудивительно, что Седоль быстро принял вызов и согласился сыграть против AlphaGo. Ли заявил, что он легко выиграет со счётом 4:1 или 5:0. Через два-три года Google захочет взять реванш, и вот тогда играть будет интересней, говорил Седоль.
С 9 по 15 марта в гостинице Four Season в Сеуле проводился матч из 5 игр по китайским правилам, где величина компенсации белым за первый ход чёрных (коми) составляет 7,5 очков. Победитель матча получал награду в 1 миллион долларов. В случае победы ИИ призовой фонд уходит на благотворительность: ЮНИСЕФ, организациям по развитию го и другим.
Внимание к играм было значительным. Технические необходимости вынудили Google проложить оптоволоконную линию связи в отель. Поисковый гигант не стал отправлять в Корею 1920 процессорных ядер и 280 видеоускорителей, на которых запускался ИИ. Вместо этого была организована связь с серверами Google Cloud Platform где-то на Среднем Западе США. Камни на доске за AlphaGo расставлял оператор Аджа Хуань (шестой любительский дан).
Матч посещали не только руководитель подразделения Демис Хассабис, но и бывший исполнительный директор Google Эрик Шмидт, а также один из ключевых инженеров компании Джефф Дин. Го — популярная в Корее игра. Матч без особых усилий пробивался на первые полосы корейских газет, на нём присутствовали члены корейского парламента. Игры транслировались на корейском, японском, китайском и английском. Только на английском на YouTube трансляции смотрели в среднем 80 тысяч человек.
Фотография сооснователя DeepMind Мустафы Сулеймана
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 186
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
В час дня по местному времени началась первая игра. Чёрные разыграли домашнюю заготовку, и в семь ходов комбинации должны были выйти за пределы любой базы. Седоль демонстрировал свой типичный стиль и атаковал. Но и AlphaGo не сдерживалась — система начала наступать примерно через 12 камней.
Как говорили комментаторы, AlphaGo играла подобно человеку: система искала и создавала уязвимые группы камней, чтобы сделать сильные ходы. Хотя ИИ сделал несколько ошибок, у чёрных были серьёзные причины для опасений. На последних двадцати минутах игры AlphaGo развила преимущество. Игра на 3,5 часа закончилась тем, что мастер девятого дана признал поражение.
Как говорил позднее Седоль, AlphaGo сделала один необычный ход, который не сделал бы ни один человек. Представитель команды людей не ожидал такой игры. Система играла заметно сильнее, чем против европейского чемпиона. Как говорил глава DeepMind Хассабис, дело даже не в вычислительных мощностях — они примерно те же, что и в матче против Хуэя. Последние пять месяцев AlphaGo играла сама против себя и использовала обучение с подкреплением, чтобы улучшить собственные навыки. Возросшая мощь стала сюрпризом.
Улучшились ли сила игры и стиль после матча с Фань Хуэем в октябре 2015 года? Все три комментирующих сходятся во мнении, что есть значительные изменения. Илья Шикшин, говорит, что программа заметно нарастила навык с октября с уровня игры чемпиона Европы до уровня чемпиона мира:
Александр Динерштейн заметил игру двух разных версий программы. Версия, которая играла с Фанем, делала значительно больше ошибок.
Фотография сооснователя DeepMind Мустафы Сулеймана
Чёрные: AlphaGo
Белые: Ли Седоль
Результат: Ли Седоль признал поражение
Ходов: 211
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
После первой игры Седоль признал, что шокирован, но сохранял оптимизм: он считал, что открывающие ходы получше позволят достичь больших шансов победы. Вторая игра сделала исход матча более ожидаемым.
Система AlphaGo играла чёрными, то есть ходила первой. ИИ делал агрессивные ходы. Начало было необычным. Комментаторы не могли сказать, плохо это или хорошо. Белые же играли консервативней.
Нейросети не настроены на максимальное количество очков. Программа ищет ходы, которые позволят достичь победы. Именно этим исследователь DeepMind Тор Грэпель объясняет странные решения. Между ходом, который даст выигрыш с преимуществом в 80 %, и ещё одним, который позволит победить в 99-процентной вероятностью с преимуществом в 1,5 очка, AlphaGo выберет последний. Иногда система теряет очки, но так она лишь улучшает шансы на выигрыш. Означает ли это, что слабые ходы — это признак уверенности машины в победе?
В первой игре у Седоля на часах ещё оставалось время. В этот раз он исчерпал его, поэтому человеку приходилось тратить всего по минуте на ход. К концу своё время исчерпала и AlphaGo, поэтому скорость обмена ходами ускорилась до предела. Но ненадолго — белые признали поражение. Как говорил глава DeepMind Хассабис, AlphaGo была уверена в победе ещё где-то с середины игры.
Могли ли в DeepMind учесть особенности конкретного игрока и заложить в ИИ его характерные черты? Максим Подоляк говорит, что технические возможности были:
Похожую точку зрения высказывает Илья Шикшин:
Однако в DeepMind говорят, что специально для Ли Седоля AlphaGo не перенастривали. Да и вряд ли можно внести большие изменения в нейросети прогоном нескольких сотен партий.
Слева направо: основатель DeepMind Демис Хассабис, обладатель девятого профессионального дана Ли Седоль, сооснователь Google Сергей Брин.
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 176
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
Возможность решить исход матча уже в этой игре привлекла к партии внимания. В Сеул без помпы прилетел сооснователь Google Сергей Брин и посетил игру. Было очевидно, что победа является демонстрацией силы технологий, которые лежат в фундаменте сервисов поискового гиганта. От рекламных предпочтений до робомобилей, умеющих передвигаться самостоятельно, почти всё гугловское в той или иной степени опирается на системы с элементами искусственного интеллекта.
Как и в первой игре, Седоль ходил чёрными, то есть первым. Также к числу благоприятных для человека моментов можно было отнести опыт двух партий. Слух утверждает, что Седоль и команда экспертов го провела ночь в поисках слабостей AlphaGo. С этим согласен Александр Динерштейн:
Действительно, в третьей игре первые ходы чёрных были агрессивными. Как говорили комментаторы матча, в первых двух играх Седоль пробовал отличный от своего обычного стиль, пытаясь надавить на слабые места системы. В третьей игре он демонстрировал свой типичный стиль с хорошим началом и сильными ко в окончании. Пусть и с ошибкой, AlphaGo показала умение работать с ко-борьбой — обычно компьютерные системы с подобным справляются слабо. В предыдущих играх случая продемонстрировать этот навык не было.
Решающая партия определила историческую ценность произошедшего. Это была третья победа AlphaGo в матче из пяти игр. Это означало, что компьютерная система уже продемонстрировала победное превосходство. Его глубину должны были показать две последующие игры.
Так AlphaGo признаёт поражение
Чёрные: AlphaGo
Белые: Ли Седоль
Результат: AlphaGo признала поражение
Ходов: 180
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
После третьего поражения человека одной из тем пресс-конференции был вопрос, есть ли у AlphaGo слабые места. Седоль упомянул, как чувствовал, что они есть. Он извинился перед корейской нацией и сообществом игроков го за показанный результат.
Седоль выбрал стратегию амаси, захватывая территорию по периметру, а не центру. Открывающие ходы белых были теми же, что и во второй игре. Белые дали чёрным захватить центр, концентрируясь на краях и в углах. Как и в предыдущих играх, Седоль исчерпал время раньше оппонента, что означало всего лишь минуту на ход.
78 ход белых оказался отличным настолько, что комментаторы описали его как тэсудзи, некоторые назвали его «рукой бога». Возможно, Седоль действительно нащупал слабое место компьютерной системы. AlphaGo ответила слабо. Как пишет глава DeepMind Демис Хассабис, на 79 ходу система допустила ошибку, посчитав, что шанс победы — 70 %. Но поняла она это только на 87 ходу. После этого ИИ запутался.
AlphaGo начала делать откровенно слабые и ужасные ходы. Система признаёт поражение, когда оценка шанса победы падает ниже 20 процентов. Об этом инженер Google Дэвид Сильвер напомнил во время перерыва, который взял Ли Седоль. Подобное нужно, чтобы сохранять культуру игры — продолжать в явно невыгодной позиции было бы неуважительно к оппоненту. Сильвер отказался комментировать серию невнятных ходов системы. Игра продолжилась, и Седоль всё так же был вынужден работать в условиях недостатка времени. ИИ допустил ещё один промах, а чуть позже признал поражение. Результатом противостояния на 4,5 часа стала первая победа человека в этом матче.
Седоль заявил, что его никогда не поздравляли так сильно за всего лишь один выигрыш. Он упомянул, что машина не настолько сильна, когда ходит чёрными.
Контрольная комната AlphaGo, Мустафа Сулейман
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 280
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
Чёрные начали в похожем на первую игру стиле. Затем Седоль попробовал размечать территорию в верхних правых и левых углах — стратегию, которую он успешно использовал в четвёртой игре. AlphaGo забирала центр. С 48 по 58 ходы человек и машина шли вровень. Но AlphaGo не увидела тэсудзи чёрных, и Ли вырвался вперёд.
Из-за небольшой ошибки AlphaGo чуть ухудшила свою позицию. В результате долгого сражения у обоих игроков кончилось время, то есть им опять пришлось размещать каждый камень за время меньше минуты. Игра вышла в глубокий ёсэ, доска была почти полностью заполнена камнями. Белые всё же смогли восстановить преимущество. Оценив позицию, Седоль понял, что проигрывает. После пяти часов он признал поражение.
Результат матча вызвал удивление — поражение одного из лучших игроков-людей, внезапная победа одной из новых систем компьютерного го. Вместо миллиона Седоль получит 170 тысяч долларов: 150 тысяч за участие и 20 тысяч за одну победу.
Отдельной проблемой является то, почему проиграл Седоль. Как говорит Илья Шикшин, он не был готов психологически:
Александр Динерштейн:
За победу над Ли Седолем «Корейская ассоциация падук» официально дала системе почётный девятый профессиональный дан. Это означает, что её считают игроком высшего уровня.
Ли Седоль — не сильнейший игрок на планете, есть и другие. К примеру, обладатель девятого профессионального дана Ке Цзе утверждает, что с вероятностью 60 % он мог бы обыграть AlphaGo. Сайт Go Ratings действительно располагает его выше в рейтинге. Вызов AlphaGo бросил и китайский мастер девятого профессионального дана Гу Ли. Ходят слухи о просьбах сыграть против Иямы Юты.
Пока для ИИ выбирают соперника, реддитор подсчитал, что AlphaGo может быть и выше лучшего из людей в рейтинге. Согласно его прикидкам по теореме Байеса, рейтинг AlphaGo — 3649, а у Цзе он 3621, ниже.
Впрочем, делать любые утверждения о силе системы рано, если вообще возможно. Опубликованы данные лишь о нескольких играх, и реальная мощь системы неясна. Да и есть ли смысл в очках рейтинга, если у системы можно будет найти уязвимое место? Как говорит Александр Динерштейн, программу было бы интересно проверить в матче против Такемии Масаки, обладателя девятого профессионального дана:
От компьютерной системы можно ожидать оригинальные и неожиданные ходы, до которых человек никогда бы не додумался. Как говорит Максим Подоляк, он видел в ходах AlphaGo естественные, объяснимые ходы исключительно сильного игрока:
Динерштейн же утверждает, что некоторые ходы AlphaGo не рассматривались людьми:
Интернет-гигант в очередной раз показал, что обладает одними из лучших в мире технологий. Именно подразделение Google первым смогло решить ещё одну задачу информатики. В DeepMind видят утилитарные применения своим наработкам: это сервисы рекомендаций покупок или анализ медицинских данных.
Но можно отвлечься от коммерческих проектов и ещё пофантазировать о го. Неважно, начнут ли компьютеры играть лучше человека или нет. Можно натравить один продукт на другой, и наблюдать за битвой двух компаний-производителей. И они есть: Facebook создаёт робота darkforest, который пока играет слабее и ещё не участвовал в официальных матчах против профессиональных игроков. В этом месяце darkforest должна побороться в компьютерном чемпионате мира в Японии. Лучшая из программ турнира сыграет против Коити Кобаяси.
Будет ли кто-то смотреть битву Facebook с Google на доске 19×19? Кстати, легко вообразить противостояние и личную неприязнь. В январе Цукерберг рассказал о своей системе в тот же день, что и Google. И если у Facebook были лишь новости о разработке, то DeepMind уже хвасталась победой над чемпионом.
Максим Подоляк:
Александр Динерштейн:
Илья Шикшин:
Можно по-разному воспринимать поражение умнейших людей, впитавших тысячелетия опыта, и победу бездушной железки с кусочками кремния внутри, запускающей программу, которой нет и двух лет. В сообществе поклонников игры кто-то относится заметно негативно. Другие видят в AlphaGo помощь в популяризации. Но го только выиграет, если будет с кем посоревноваться и у кого поучиться, замечает Илья Шикшин:
Александр Динерштейн:
Также возможно решение задач, которые не получаются у людей:
Если же системы силы AlphaGo станут нормой, то будет легко сжульничать и использовать ходы подобной системы. Пока что чемпиона обыгрывает огромный вычислительный кластер. Протащить его с собой физически невозможно. Сегодня вычислительной мощности смартфона хватает для того, чтобы положить на лопатки в шахматах любого человека. Так произошло не сразу, но следует ожидать подобное и для го в близком будущем. Когда-нибудь возможность обмана уместится в кармане даже при отсутствии радиосвязи. Как говорит Динерштейн, сейчас к электронным устройствам на чемпионатах по го относятся расслаблено:
Алгоритм был создан за месяцы, его обучали игре на человеческих партиях, а затем он самостоятельно достиг высочайшего уровня. Это одна из лучших наглядных демонстраций силы и скорости ИИ.
Как говорит Илья Шикшин, его поразила та скорость, с которой система научилась игре:
Является ли AlphaGo искусственным интеллектом?
Система научилась играть в го на партиях людей. Искусственные нейронные сети видели столько партий, сколько ни один человек не сыграет за всю свою жизнь. Затем в играх против самой себя система довела навык до уровня, который приносит победу над лучшими из людей. Это не случай Deep Blue, когда алгоритм поиска решения задавался полностью вручную.
Это вряд ли чем-то отличается от того, как мы учимся речи. Дети как-то приобретают возможность повторять слова, складывать слова в предложения, а затем выражать свои мысли полученными фрагментами. На это уходят годы тренировок, такое возможно только в некоторые моменты жизни, когда мозг наиболее восприимчив. Чем AlphaGo отличается от человека, который научился говорить, а после отточил навык до написания литературы?
Можно заглянуть внутрь проекта и испытать сильное разочарование: там алгоритмы, которые можно истолковать и понять. Но при этом свою цель AlphaGo выполняет отлично. Это и есть проблема: ИИ в представлении скептиков должен быть необъяснимым, уметь всё и ненавидеть человечество. Простое выполнение задачи вызывает обвинения в просчитывании вариантов.
Но вопрос о сущности терминов не так интересен. Куда больше пугает мысль, что AlphaGo играет в го лучше всех своих создателей и даже людей, на партиях которых учили его нейросети.
Уничтожит ли искусственный интеллект нас?
Подверженные эффекту искусственного интеллекта иногда требуют, чтобы программы осознавали себя. Именно этого в ИИ не закладывают. IBM Watson обыграл людей в интеллектуальную игру Jeopardy, но не знает об этом. Он не мечется в желании играть ещё. Он не радуется победе. Он даже не понимает, что победил. У него нет сознания.
ИИ — это не каноничные образы в виде красной лампочки HAL9000 или злобного «Скайнета». Искусственный интеллект не обладает сознанием. Это всего лишь компьютерная программа, «умная» настолько, чтобы выполнять задачи, которые обычно требуют участия анализа человека. Это не хладнокровная машина для убийств.
К примеру, сегодня выходит слишком много научных статей и исследований. Прочитать все физически невозможно. Нужна система, которая смогла бы прочесть и упорядочить эти чудовищные массивы информации. И такая система будет обладать искусственным интеллектом.
Но этот ИИ не станет убивать людей. Скорее, он займёт их рабочие места.
Оставит ли ИИ нас без работы?
Искусственный интеллект может в разы повысить эффективность труда. Именно это и должно внушать опасения.
На заре цивилизации производством еды занимались все, но её едва хватало. Сегодня сельским хозяйством не занимается почти никто, но еда в избытке. Ответ на эту загадку — в производительности труда и эффективности инструментов.
Система перевода, которая требует лишь вычитки и сравнения терминов, может в разы облегчить жизнь переводчика. Означает ли это, что половина переводчиков рискует остаться без работы?
Простой анализ текста позволит выделить горячую фразу в статье, а затем постить подобное с ссылкой на оригинал через API соцсетей. Означает ли это, что ряды SMM-щиков поредеют?
Ответ на требования поднять минимальный размер оплаты труда кассирам.
Флотилия беспилотных грузовиков будет самостоятельно передвигаться между городами, а за руль лишь иногда будет усаживаться водитель, чтобы припарковаться. Что делать с огромной массой освободившихся дальнобойщиков?
Анализируя видеопоток трансляции спортивного матча, робот может составить новостную статью, которая никак не будет отличаться от написанного человеком. Где в этом сценарии больше рабочих мест для журналистов?
Экспертная система оценит юридический документ и составит своё решение по нему. Как поступить с освободившейся армией младшего персонала в юридических фирмах?
Опасна даже не потеря рабочих мест, а их характер. В первую очередь начнут исчезать простые низкооплачиваемые виды работы. Занятые на подобных позициях наиболее экономически уязвимы.
Сможем ли мы адаптироваться к глубоким социальным изменениям, которые произойдут даже не революцией, а резкой вспышкой? Кто останется в выигрыше от ИИ: лишь те, кто владеет такой системой? Означает ли это очередное усиление социального неравенства?
Это и есть те вопросы, которые должны пугать при очередной оттепели зимы ИИ. Должна быть вовсе не эта первобытная фобия всемогущих механических убийц. Новости о восстании машин так и останутся заголовками «робот убил человека». Технологии — лишь инструмент. Опасность для людей создают другие люди.
AlphaGo — это ещё один вестник такого неясного будущего перемен. А вот угрозой для го этот ИИ не является хотя бы потому, что игра благодаря ему становится только популярней. Не может сделать хуже ещё один игрок, за партиями которого следят миллионы.
Играл Ли Седоль, обладатель девятого профессионального дана, один из лучших мастеров го в мире. Его оппонентом стала система компьютерного го AlphaGo, разработка Google DeepMind. До начала матча считалось, что ни один продукт не способен обыграть мастера высокого уровня. Но ИИ одержал победу со счётом 4:1.
Интересна скорость, с которой AlphaGo отточила го. Ещё в прошлом октябре системе для показательного матча скормили игрока куда слабее. Спустя пять месяцев она обходит одного из лучших. Похоже, что мы достигли 1997 года в шахматах, когда компьютер впервые обыграл действующего чемпиона в матче. С того момента шахматные программы улучшили навыки до такого уровня, что человек больше не способен выиграть у них в нормальных условиях.
Ожидает ли подобное го? Стоит ли бояться силы искусственного интеллекта? Мне удалось получить комментарии и ответы, которые предоставили вице-президент «Российской федерации го» и президент «Спортивной федерации го Санкт-Петербурга» Максим Подоляк, профессиональные игроки в го и многократные чемпионы Европы Илья Шикшин (первый профессиональный дан) и Александр Динерштейн (третий профессиональный дан).
Сложности го
Эту победу можно сравнить с другим историческим матчем. В 1997 году суперкомпьютер Deep Blue впервые в мире обыграл в матче действующего шахматного чемпиона мира. Проигрыш Каспарова не стал последним поражением людей. В последующие годы компьютерные -шахматы достигли точки, когда даже сильнейшие из шахматистов не могут обыграть их в нормальных условиях.
Го (бадук, вэйци) — настольная игра, которая зародилась в Древнем Китае и получила значительную популярность в Южной Корее, Китае и Японии. Сегодня в го играют около 60 миллионов людей. Игроки размещают на доске определённого размера камни двух цветов. Целью является отгородить на доске область большего, чем оппонент, размера.
Президент Международной шахматной федерации не без удовольствия говорит о том, что теперь участь шахмат ждёт и го.
С точки зрения создания ИИ, го при внешней простоте в разы сложнее шахмат — в гугол (10100) раз, если точнее. Именно в столько раз больше возможных позиций камней на стандартной доске 19×19, чем в шахматах. До появления AlphaGo считалось, что пока что любые программы играют на уровне любителей, и до уровня мастеров им ещё десятилетие.
Размер доски — далеко не единственное препятствие. Неприменимы многие алгоритмы, которые использовались для шахмат. Количество ходов больше, чем в шахматах. Игра начинается с 55 возможных ходов, а вскоре нужно учитывать почти все из 361 точек на доске. Какие-то из ходов популярней, какие-то почти никогда не используются. Начальные ходы партии — фусэки — быстро начинают уходить во что-то оригинальное. В шахматах фигуры убывают с доски, в го они добавляются (пусть и возможно удаление путём захвата камней). Это исключает создание базы окончаний партий. Существующие системы плохо справляются с окончанием игры, в том числе это случается из-за ко-борьбы.
Системы компьютерного го всё же существуют. Чаще всего подобные продукты оценивают ходы с помощью поиска по дереву или метода Монте-Карло, задействуют экспертные системы с базой хороших ходов, сопоставление с образцом и машинное обучение. Такие продукты как Crazy Stone, Zen или GnuGo могут показать неплохой результат, но они всё равно проигрывают профессионалам.
В 1989 году Goliath не смогла выиграть у любительского шестого дана с огромной форой в 17 камней. До AlphaGo высшим достижением считался выигрыш при 4 камнях форы. В этом году ждали снижения до 3 камней форы. Но вдруг появилась система, которая на равных «всухую» выигрывает у чемпионов.
Силы сторон
AlphaGo
Возраст: менее 2 лет
Страна: Великобритания
Дан: ?
В 2014 году Google купила DeepMind, британскую компанию по разработкам искусственного интеллекта. Именно DeepMind в прошлом привлекла внимание созданием искусственного интеллекта DQN, который самостоятельно научился играть в 49 старых игр Atari. При описании другого продукта компании — AlphaGo — тоже можно употребить слово «самостоятельно».
Эта система компьютерного го упрощённо состоит из комбинации метода Монте-Карло и нейросетей политики (policy networks) и ценности (value networks). Нейросети натренировывали в нескольких стадиях машинного обучения с помощью 160 тыс. партий с 28,4 млн позиций с сервера KGS игроков с шестого по девятый дан. Ещё миллион позиций был выделен для тестов. Сначала проводилось контролируемое обучение сети политики прямо с помощью ходов игроков-людей. Другая сеть политики подвергалась обучению с подкреплением. Вторая играла с первой и оптимизировала её, чтобы политика сдвигалась к выигрышу, а не просто предсказаниям ходов. Наконец, проводилось обучение с подкреплением сети ценности, которая предсказывает победителя игр, в которые играют сети политики. Был достигнут результат корректного предсказания следующего хода в 57 % случаев. До AlphaGo лучший результат составлял 44 %.
Подробнее технические составляющие рассматривались как на «Гиктаймсе», так и на «Хабре».
AlphaGo сравнивали с другими программами — она почти всегда обыгрывает любых конкурентов — и игроком-человеком. Для этого при участии судьи из «Британской федерации го» был организован матч против трёхкратного европейского чемпиона и обладателя второго профессионального дана Фань Хуэя. Все пять игр Хуэй проиграл.
Ли Седоль
Возраст: 33 года
Страна: Южная Корея
Дан: 9 профессиональный
Другой участник матча — профессиональный игрок в го Ли Седоль. Свой первый профессиональный дан Седоль получил в 1996 году в возрасте 13 лет. Седоль имеет 18 международных титулов, он входит в пятёрку сильнейших игроков мира.
AlphaGo обыграла чемпиона Европы, где уровень владения го ниже. При этом ошибки делали как программа, так и Хуэй. Неудивительно, что Седоль быстро принял вызов и согласился сыграть против AlphaGo. Ли заявил, что он легко выиграет со счётом 4:1 или 5:0. Через два-три года Google захочет взять реванш, и вот тогда играть будет интересней, говорил Седоль.
Ход событий
С 9 по 15 марта в гостинице Four Season в Сеуле проводился матч из 5 игр по китайским правилам, где величина компенсации белым за первый ход чёрных (коми) составляет 7,5 очков. Победитель матча получал награду в 1 миллион долларов. В случае победы ИИ призовой фонд уходит на благотворительность: ЮНИСЕФ, организациям по развитию го и другим.
Внимание к играм было значительным. Технические необходимости вынудили Google проложить оптоволоконную линию связи в отель. Поисковый гигант не стал отправлять в Корею 1920 процессорных ядер и 280 видеоускорителей, на которых запускался ИИ. Вместо этого была организована связь с серверами Google Cloud Platform где-то на Среднем Западе США. Камни на доске за AlphaGo расставлял оператор Аджа Хуань (шестой любительский дан).
The press pack is just wild! pic.twitter.com/9KS04YlwpQ
— Mustafa Suleyman (@mustafasuleymn) 9 марта 2016 г.
Матч посещали не только руководитель подразделения Демис Хассабис, но и бывший исполнительный директор Google Эрик Шмидт, а также один из ключевых инженеров компании Джефф Дин. Го — популярная в Корее игра. Матч без особых усилий пробивался на первые полосы корейских газет, на нём присутствовали члены корейского парламента. Игры транслировались на корейском, японском, китайском и английском. Только на английском на YouTube трансляции смотрели в среднем 80 тысяч человек.
9 марта, среда. Игра первая
Фотография сооснователя DeepMind Мустафы Сулеймана
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 186
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
В час дня по местному времени началась первая игра. Чёрные разыграли домашнюю заготовку, и в семь ходов комбинации должны были выйти за пределы любой базы. Седоль демонстрировал свой типичный стиль и атаковал. Но и AlphaGo не сдерживалась — система начала наступать примерно через 12 камней.
Как говорили комментаторы, AlphaGo играла подобно человеку: система искала и создавала уязвимые группы камней, чтобы сделать сильные ходы. Хотя ИИ сделал несколько ошибок, у чёрных были серьёзные причины для опасений. На последних двадцати минутах игры AlphaGo развила преимущество. Игра на 3,5 часа закончилась тем, что мастер девятого дана признал поражение.
Как говорил позднее Седоль, AlphaGo сделала один необычный ход, который не сделал бы ни один человек. Представитель команды людей не ожидал такой игры. Система играла заметно сильнее, чем против европейского чемпиона. Как говорил глава DeepMind Хассабис, дело даже не в вычислительных мощностях — они примерно те же, что и в матче против Хуэя. Последние пять месяцев AlphaGo играла сама против себя и использовала обучение с подкреплением, чтобы улучшить собственные навыки. Возросшая мощь стала сюрпризом.
Улучшились ли сила игры и стиль после матча с Фань Хуэем в октябре 2015 года? Все три комментирующих сходятся во мнении, что есть значительные изменения. Илья Шикшин, говорит, что программа заметно нарастила навык с октября с уровня игры чемпиона Европы до уровня чемпиона мира:
«Надо сказать, что это значительная разница. Опубликованные партии программы против Фан Хуэя, оставляли большие сомнения, что АльфаГо сможет победить Ли Седоля. Но за эти несколько месяцев программе удалось сделать большой скачок.»
«Ли Седоль не знал, с кем играет. И то, что он в первой партии пытался спровоцировать программу на ошибку с помощью нестандартный первых ходов — именно об этом свидетельствует. Вместо того, чтобы пытаться найти слабые места у программы, ему следовало играть в свою нормальную игру. В этом случае было бы неочевидно, кто победит.»
Александр Динерштейн заметил игру двух разных версий программы. Версия, которая играла с Фанем, делала значительно больше ошибок.
10 марта, четверг. Игра вторая
Фотография сооснователя DeepMind Мустафы Сулеймана
Чёрные: AlphaGo
Белые: Ли Седоль
Результат: Ли Седоль признал поражение
Ходов: 211
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
После первой игры Седоль признал, что шокирован, но сохранял оптимизм: он считал, что открывающие ходы получше позволят достичь больших шансов победы. Вторая игра сделала исход матча более ожидаемым.
Система AlphaGo играла чёрными, то есть ходила первой. ИИ делал агрессивные ходы. Начало было необычным. Комментаторы не могли сказать, плохо это или хорошо. Белые же играли консервативней.
Нейросети не настроены на максимальное количество очков. Программа ищет ходы, которые позволят достичь победы. Именно этим исследователь DeepMind Тор Грэпель объясняет странные решения. Между ходом, который даст выигрыш с преимуществом в 80 %, и ещё одним, который позволит победить в 99-процентной вероятностью с преимуществом в 1,5 очка, AlphaGo выберет последний. Иногда система теряет очки, но так она лишь улучшает шансы на выигрыш. Означает ли это, что слабые ходы — это признак уверенности машины в победе?
В первой игре у Седоля на часах ещё оставалось время. В этот раз он исчерпал его, поэтому человеку приходилось тратить всего по минуте на ход. К концу своё время исчерпала и AlphaGo, поэтому скорость обмена ходами ускорилась до предела. Но ненадолго — белые признали поражение. Как говорил глава DeepMind Хассабис, AlphaGo была уверена в победе ещё где-то с середины игры.
Могли ли в DeepMind учесть особенности конкретного игрока и заложить в ИИ его характерные черты? Максим Подоляк говорит, что технические возможности были:
«Поскольку база профессиональных игр находится в открытом доступе, было бы удивительно, если бы их не использовали в подготовке AlphaGo. Таким образом, можно ожидать, что программа имеет подробный профиль на всех профессиональных игроков, поскольку его построение ничем принципиально не отличается от построения профиля пользовательских предпочтений. А уж в этом Google силён.»
Похожую точку зрения высказывает Илья Шикшин:
«Уверен, что в неё загрузили все имеющиеся в открытом доступе партии Ли Седоля (более 1000). Знание этих партий и возможность их в любой момент воспроизвести, могли дать преимущество программе, в то время как Ли Седоль до матча мог изучить лишь партии программы против Фань Хуэя, где уровень AlphaGo был существенно ниже.»
Однако в DeepMind говорят, что специально для Ли Седоля AlphaGo не перенастривали. Да и вряд ли можно внести большие изменения в нейросети прогоном нескольких сотен партий.
12 марта, суббота. Игра третья
Слева направо: основатель DeepMind Демис Хассабис, обладатель девятого профессионального дана Ли Седоль, сооснователь Google Сергей Брин.
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 176
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
Возможность решить исход матча уже в этой игре привлекла к партии внимания. В Сеул без помпы прилетел сооснователь Google Сергей Брин и посетил игру. Было очевидно, что победа является демонстрацией силы технологий, которые лежат в фундаменте сервисов поискового гиганта. От рекламных предпочтений до робомобилей, умеющих передвигаться самостоятельно, почти всё гугловское в той или иной степени опирается на системы с элементами искусственного интеллекта.
Как и в первой игре, Седоль ходил чёрными, то есть первым. Также к числу благоприятных для человека моментов можно было отнести опыт двух партий. Слух утверждает, что Седоль и команда экспертов го провела ночь в поисках слабостей AlphaGo. С этим согласен Александр Динерштейн:
«Я слышал, что Ли Седоль не спал ночами, анализируя партии и готовясь к матчу в компании своих коллег – корейских профессионалов го. Слабости программы были найдены, но использовать их не удалось. Как мне кажется, ему надо было играть активнее. С борьбой, как он обычно и делает. Мирное го, которое мы видели на протяжении всего матча – не его конек.»
Действительно, в третьей игре первые ходы чёрных были агрессивными. Как говорили комментаторы матча, в первых двух играх Седоль пробовал отличный от своего обычного стиль, пытаясь надавить на слабые места системы. В третьей игре он демонстрировал свой типичный стиль с хорошим началом и сильными ко в окончании. Пусть и с ошибкой, AlphaGo показала умение работать с ко-борьбой — обычно компьютерные системы с подобным справляются слабо. В предыдущих играх случая продемонстрировать этот навык не было.
Решающая партия определила историческую ценность произошедшего. Это была третья победа AlphaGo в матче из пяти игр. Это означало, что компьютерная система уже продемонстрировала победное превосходство. Его глубину должны были показать две последующие игры.
13 марта, воскресенье. Игра четвёртая
Так AlphaGo признаёт поражение
Чёрные: AlphaGo
Белые: Ли Седоль
Результат: AlphaGo признала поражение
Ходов: 180
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
После третьего поражения человека одной из тем пресс-конференции был вопрос, есть ли у AlphaGo слабые места. Седоль упомянул, как чувствовал, что они есть. Он извинился перед корейской нацией и сообществом игроков го за показанный результат.
Седоль выбрал стратегию амаси, захватывая территорию по периметру, а не центру. Открывающие ходы белых были теми же, что и во второй игре. Белые дали чёрным захватить центр, концентрируясь на краях и в углах. Как и в предыдущих играх, Седоль исчерпал время раньше оппонента, что означало всего лишь минуту на ход.
78 ход белых оказался отличным настолько, что комментаторы описали его как тэсудзи, некоторые назвали его «рукой бога». Возможно, Седоль действительно нащупал слабое место компьютерной системы. AlphaGo ответила слабо. Как пишет глава DeepMind Демис Хассабис, на 79 ходу система допустила ошибку, посчитав, что шанс победы — 70 %. Но поняла она это только на 87 ходу. После этого ИИ запутался.
AlphaGo начала делать откровенно слабые и ужасные ходы. Система признаёт поражение, когда оценка шанса победы падает ниже 20 процентов. Об этом инженер Google Дэвид Сильвер напомнил во время перерыва, который взял Ли Седоль. Подобное нужно, чтобы сохранять культуру игры — продолжать в явно невыгодной позиции было бы неуважительно к оппоненту. Сильвер отказался комментировать серию невнятных ходов системы. Игра продолжилась, и Седоль всё так же был вынужден работать в условиях недостатка времени. ИИ допустил ещё один промах, а чуть позже признал поражение. Результатом противостояния на 4,5 часа стала первая победа человека в этом матче.
Седоль заявил, что его никогда не поздравляли так сильно за всего лишь один выигрыш. Он упомянул, что машина не настолько сильна, когда ходит чёрными.
15 марта, вторник. Игра пятая
Контрольная комната AlphaGo, Мустафа Сулейман
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 280
Ходы
Полная трансляция
Краткое содержание игры на английском
Комментарии «Российской федерации го»
Пост на Geektimes
Чёрные начали в похожем на первую игру стиле. Затем Седоль попробовал размечать территорию в верхних правых и левых углах — стратегию, которую он успешно использовал в четвёртой игре. AlphaGo забирала центр. С 48 по 58 ходы человек и машина шли вровень. Но AlphaGo не увидела тэсудзи чёрных, и Ли вырвался вперёд.
Из-за небольшой ошибки AlphaGo чуть ухудшила свою позицию. В результате долгого сражения у обоих игроков кончилось время, то есть им опять пришлось размещать каждый камень за время меньше минуты. Игра вышла в глубокий ёсэ, доска была почти полностью заполнена камнями. Белые всё же смогли восстановить преимущество. Оценив позицию, Седоль понял, что проигрывает. После пяти часов он признал поражение.
Вопросы
Что матч значит для Ли Седоля?
Результат матча вызвал удивление — поражение одного из лучших игроков-людей, внезапная победа одной из новых систем компьютерного го. Вместо миллиона Седоль получит 170 тысяч долларов: 150 тысяч за участие и 20 тысяч за одну победу.
Отдельной проблемой является то, почему проиграл Седоль. Как говорит Илья Шикшин, он не был готов психологически:
АльфаГо сумела победить Ли Седоля. Однако это вовсе не означает, что программа играет сильнее. Думаю, что их уровень примерно одинаковый. Просто Ли Седоль не был психологически готов бороться с программой в первых партиях, так как для него стало огромной неожиданностью то, что программа может с ним бороться на равных.
Александр Динерштейн:
Я признаю, что не ожидал такого расклада. Как и большинство профессионалов го был уверен, что Ли Седоль легко победит. Но ошибки программы мы видели. Я верю в то, что вопрос еще остается открытым. Ли Седоль даже у себя в Корее не является первым номером в рейтинге. Я думаю, что у других профессионалов его уровня есть шансы на победу, особенно, если мы увидим подборки партий, сыгранных программой, по которым можно будет искать ее слабости в игре
Что матч значит для AlphaGo?
За победу над Ли Седолем «Корейская ассоциация падук» официально дала системе почётный девятый профессиональный дан. Это означает, что её считают игроком высшего уровня.
Ли Седоль — не сильнейший игрок на планете, есть и другие. К примеру, обладатель девятого профессионального дана Ке Цзе утверждает, что с вероятностью 60 % он мог бы обыграть AlphaGo. Сайт Go Ratings действительно располагает его выше в рейтинге. Вызов AlphaGo бросил и китайский мастер девятого профессионального дана Гу Ли. Ходят слухи о просьбах сыграть против Иямы Юты.
Пока для ИИ выбирают соперника, реддитор подсчитал, что AlphaGo может быть и выше лучшего из людей в рейтинге. Согласно его прикидкам по теореме Байеса, рейтинг AlphaGo — 3649, а у Цзе он 3621, ниже.
Впрочем, делать любые утверждения о силе системы рано, если вообще возможно. Опубликованы данные лишь о нескольких играх, и реальная мощь системы неясна. Да и есть ли смысл в очках рейтинга, если у системы можно будет найти уязвимое место? Как говорит Александр Динерштейн, программу было бы интересно проверить в матче против Такемии Масаки, обладателя девятого профессионального дана:
«Он был одним из сильнейших мастеров в мире начала 90-х. Мы заметили, что программа предпочитает игру на центр, на влияние. Ли Седоль во всех партиях брал очки в углах. А Такемия-сенсей известен тем, что сам очень любит играть на центр и совсем не «жадничает» в начале партии. Непонятно, как повела бы себя программа против такого необычного стиля игры.»
От компьютерной системы можно ожидать оригинальные и неожиданные ходы, до которых человек никогда бы не додумался. Как говорит Максим Подоляк, он видел в ходах AlphaGo естественные, объяснимые ходы исключительно сильного игрока:
«Как говорится в одной книжке — партия течёт подобно потоку со склона горы, естественно и мощно. Впечатляюще сильно выглядел б.102 в первой партии. Но это не «божественный» ход.»
Динерштейн же утверждает, что некоторые ходы AlphaGo не рассматривались людьми:
«Один из комментаторов матча, Ким Сонгрёнг, 9 дан (Корея), даже поблагодарил программу за вклад в развитие теории Го. Еще десятилетия тому назад Фудзисава Cуко, один из лидеров японского Го утверждал, что знает лишь 5 % игры Го. Остальные 95 – это те знания, которыми люди пока не обладают. Видимо, программа смогла познать игру еще глубже.
Что матч значит для Google?
Интернет-гигант в очередной раз показал, что обладает одними из лучших в мире технологий. Именно подразделение Google первым смогло решить ещё одну задачу информатики. В DeepMind видят утилитарные применения своим наработкам: это сервисы рекомендаций покупок или анализ медицинских данных.
Но можно отвлечься от коммерческих проектов и ещё пофантазировать о го. Неважно, начнут ли компьютеры играть лучше человека или нет. Можно натравить один продукт на другой, и наблюдать за битвой двух компаний-производителей. И они есть: Facebook создаёт робота darkforest, который пока играет слабее и ещё не участвовал в официальных матчах против профессиональных игроков. В этом месяце darkforest должна побороться в компьютерном чемпионате мира в Японии. Лучшая из программ турнира сыграет против Коити Кобаяси.
Будет ли кто-то смотреть битву Facebook с Google на доске 19×19? Кстати, легко вообразить противостояние и личную неприязнь. В январе Цукерберг рассказал о своей системе в тот же день, что и Google. И если у Facebook были лишь новости о разработке, то DeepMind уже хвасталась победой над чемпионом.
Максим Подоляк:
Вряд ли. Это было бы примерно то же самое, что смотреть на то, как программа рисует фракталы или цветные пятна заставки на мониторе. Никого не интересует механический перебор вариантов, в этом нет ничего феноменального. А вот то, что это может делать человек — феномен.
Александр Динерштейн:
У шахматистов подобные матчи давно проводятся и не вызывают особого интереса. Лично я с удовольствием бы посмотрел за турниром программ, который комментировался бы человеком. Кстати, за турниром топ-профи с комментариями AlphaGo было бы не менее интересно понаблюдать.
Илья Шикшин:
Думаю, что матчи между компьютерными программами могут вызывать у людей интерес. Подобные матчи уже транслировались и собирали несколько сотен зрителей. Уровень человека в го ещё далек очень от совершенства. Есть куда расти и развиваться.
Что матч значит для го?
Можно по-разному воспринимать поражение умнейших людей, впитавших тысячелетия опыта, и победу бездушной железки с кусочками кремния внутри, запускающей программу, которой нет и двух лет. В сообществе поклонников игры кто-то относится заметно негативно. Другие видят в AlphaGo помощь в популяризации. Но го только выиграет, если будет с кем посоревноваться и у кого поучиться, замечает Илья Шикшин:
«Программа играла очень достойно и заслуженно победила. Мог ли этот матч закончиться иначе? Думаю, нет. Уверен, что Ли Седоль многое для себя открыл за эти 5 партий. Теперь он должно быть готов бороться с АльфаГо, но, увы, уже поздно. Го-мир получил серьезного соперника в лице этой программы.
Но открытия сделал не один Ли Седоль. Миллионы людей, следившие за этим матчем, также открыли для себя нечто новое. Кто-то — огромные возможности технологий и искуственного интеллекта, кто-то нашел нечто новое в игре и теперь смотрит на нее иначе, ну а для кого-то сама игра го стала открытием.
Лично мне очень приятно видеть, что моя любимая игра в эти дни стала центром внимания всего мира. Полагаю, что с го теперь все будет только лучше.»
Александр Динерштейн:
«Я подозреваю, что призовые в странах Азии могут уменьшиться, но для остального мира плюсы от рекламы матча, а она была колоссальной, должны перевесить. Я ожидаю приток в го новых игроков, а этому мы должны быть только рады. Многие вообще впервые об этой игре услышали.»
Также возможно решение задач, которые не получаются у людей:
«Мир го конечно расстроен, но с появлением программы мы можем узнать много интересного. К примеру, в го существует задачка, придуманная в 1713 году известным японским мастером Досецу Инсеки. Расчет идет на двести ходов вперед. По ней изданы целые книги, но так никто и не смог ее решить. Существуют красивые решения, но они отличаются от изначально объявленного автором задания. Наконец-то мы узнаем, есть ли у этой задачи решение. Или может быть, ошибался сам Досецу?»
Если же системы силы AlphaGo станут нормой, то будет легко сжульничать и использовать ходы подобной системы. Пока что чемпиона обыгрывает огромный вычислительный кластер. Протащить его с собой физически невозможно. Сегодня вычислительной мощности смартфона хватает для того, чтобы положить на лопатки в шахматах любого человека. Так произошло не сразу, но следует ожидать подобное и для го в близком будущем. Когда-нибудь возможность обмана уместится в кармане даже при отсутствии радиосвязи. Как говорит Динерштейн, сейчас к электронным устройствам на чемпионатах по го относятся расслаблено:
«У нас на турнирах люди все еще записывают партии на планшеты. В кармане можно иметь телефон и даже выходить с ним в туалет. Но скоро все это изменится и по мерам безопасности мы приблизимся к шахматам, где уже дошли до глушилок сотовой связи и задержек в трансляциях партий (чтобы сложнее было подсказывать). Да и в Интернете у нас до сих пор проходят довольно крупные турниры, к примеру, командный чемпионат Европы. За много лет его проведения не возникало скандалов связанных с подозрением в нечестной игре. Да, можно было открыть базу дебютов, но не факт, что она реально помогает.»
Что матч означает для систем искусственного интеллекта?
Алгоритм был создан за месяцы, его обучали игре на человеческих партиях, а затем он самостоятельно достиг высочайшего уровня. Это одна из лучших наглядных демонстраций силы и скорости ИИ.
Как говорит Илья Шикшин, его поразила та скорость, с которой система научилась игре:
«За короткий промежуток времени программа научилась играть на самом высоком уровне. Мне было интересно наблюдать, как ведет себя программа, когда выигрывает и когда терпит поражение.»
Что матч означает для всех нас?
Является ли AlphaGo искусственным интеллектом?
Система научилась играть в го на партиях людей. Искусственные нейронные сети видели столько партий, сколько ни один человек не сыграет за всю свою жизнь. Затем в играх против самой себя система довела навык до уровня, который приносит победу над лучшими из людей. Это не случай Deep Blue, когда алгоритм поиска решения задавался полностью вручную.
Это вряд ли чем-то отличается от того, как мы учимся речи. Дети как-то приобретают возможность повторять слова, складывать слова в предложения, а затем выражать свои мысли полученными фрагментами. На это уходят годы тренировок, такое возможно только в некоторые моменты жизни, когда мозг наиболее восприимчив. Чем AlphaGo отличается от человека, который научился говорить, а после отточил навык до написания литературы?
Можно заглянуть внутрь проекта и испытать сильное разочарование: там алгоритмы, которые можно истолковать и понять. Но при этом свою цель AlphaGo выполняет отлично. Это и есть проблема: ИИ в представлении скептиков должен быть необъяснимым, уметь всё и ненавидеть человечество. Простое выполнение задачи вызывает обвинения в просчитывании вариантов.
Но вопрос о сущности терминов не так интересен. Куда больше пугает мысль, что AlphaGo играет в го лучше всех своих создателей и даже людей, на партиях которых учили его нейросети.
Уничтожит ли искусственный интеллект нас?
Подверженные эффекту искусственного интеллекта иногда требуют, чтобы программы осознавали себя. Именно этого в ИИ не закладывают. IBM Watson обыграл людей в интеллектуальную игру Jeopardy, но не знает об этом. Он не мечется в желании играть ещё. Он не радуется победе. Он даже не понимает, что победил. У него нет сознания.
ИИ — это не каноничные образы в виде красной лампочки HAL9000 или злобного «Скайнета». Искусственный интеллект не обладает сознанием. Это всего лишь компьютерная программа, «умная» настолько, чтобы выполнять задачи, которые обычно требуют участия анализа человека. Это не хладнокровная машина для убийств.
К примеру, сегодня выходит слишком много научных статей и исследований. Прочитать все физически невозможно. Нужна система, которая смогла бы прочесть и упорядочить эти чудовищные массивы информации. И такая система будет обладать искусственным интеллектом.
Но этот ИИ не станет убивать людей. Скорее, он займёт их рабочие места.
Оставит ли ИИ нас без работы?
Искусственный интеллект может в разы повысить эффективность труда. Именно это и должно внушать опасения.
На заре цивилизации производством еды занимались все, но её едва хватало. Сегодня сельским хозяйством не занимается почти никто, но еда в избытке. Ответ на эту загадку — в производительности труда и эффективности инструментов.
Система перевода, которая требует лишь вычитки и сравнения терминов, может в разы облегчить жизнь переводчика. Означает ли это, что половина переводчиков рискует остаться без работы?
Простой анализ текста позволит выделить горячую фразу в статье, а затем постить подобное с ссылкой на оригинал через API соцсетей. Означает ли это, что ряды SMM-щиков поредеют?
Ответ на требования поднять минимальный размер оплаты труда кассирам.
Флотилия беспилотных грузовиков будет самостоятельно передвигаться между городами, а за руль лишь иногда будет усаживаться водитель, чтобы припарковаться. Что делать с огромной массой освободившихся дальнобойщиков?
Анализируя видеопоток трансляции спортивного матча, робот может составить новостную статью, которая никак не будет отличаться от написанного человеком. Где в этом сценарии больше рабочих мест для журналистов?
Экспертная система оценит юридический документ и составит своё решение по нему. Как поступить с освободившейся армией младшего персонала в юридических фирмах?
Опасна даже не потеря рабочих мест, а их характер. В первую очередь начнут исчезать простые низкооплачиваемые виды работы. Занятые на подобных позициях наиболее экономически уязвимы.
Сможем ли мы адаптироваться к глубоким социальным изменениям, которые произойдут даже не революцией, а резкой вспышкой? Кто останется в выигрыше от ИИ: лишь те, кто владеет такой системой? Означает ли это очередное усиление социального неравенства?
Это и есть те вопросы, которые должны пугать при очередной оттепели зимы ИИ. Должна быть вовсе не эта первобытная фобия всемогущих механических убийц. Новости о восстании машин так и останутся заголовками «робот убил человека». Технологии — лишь инструмент. Опасность для людей создают другие люди.
AlphaGo — это ещё один вестник такого неясного будущего перемен. А вот угрозой для го этот ИИ не является хотя бы потому, что игра благодаря ему становится только популярней. Не может сделать хуже ещё один игрок, за партиями которого следят миллионы.