Ученые из Microsoft Research (MSR) Азия создали систему на основе искусственного интеллекта (ИИ), которая обучилась тонкостям игры в маджонг. Маджонг считается одной из наиболее сложных игр с точки зрения освоения алгоритмами, т.к. в ней присутствует случайный фактор.
Super Phoenix (Suphx) стала первой ИИ-системой, которая получила 10-й дан (разряд) на Tenhou, онлайн-платформе для соревнований по риичи-маджонг, насчитывающей более 300 000 участников со всего мира. Такой квалификацией обладают всего 180 человек. Это максимальный на данный момент разряд для алгоритма, на более высоком уровне играют только несколько признанных профессионалов.
Для создания системы использовалось глубокое обучение с подкреплением (deep reinforcement learning) – комплексный принцип обучения алгоритмов, основанный на комбинации глубокого обучения и обучения с подкреплением. Suphx освоила тонкости маджонга, поучаствовав в 5000 игр за 4 месяца. Система постепенно увеличивала качество и скорость игры. Сейчас у алгоритма есть собственная стратегия, которая включает намеренно слабые ходы, позволяющие в итоге получить большее преимущество.
В отличие от шахмат и го, в которых ИИ уже добился значительных успехов, маджонг является игрой с неполной информацией. Участникам известны не все факторы, например, нельзя увидеть изображения на костяшках соперника. Процесс игры напоминает покер – от участников требуется хорошая память, наблюдательность, стратегическое мышление и умение блефовать.
По мнению ученых из MSR наличие случайного фактора в маджонге является уникальным вызовом для систем ИИ, а полученный опыт в обучении алгоритмов нелинейным задачам сможет найти свое применение в реальных жизненных ситуациях, сопряжённых с набором неизвестных факторов.
Ранее Microsoft Research и Maluuba обучили искусственный интеллект игре в Ms. Pac-Man, которая была выпущена для одной из первых домашних консолей Atari 2600. Алгоритм побил мировой рекорд, набрав 999 990 баллов, тогда как лучший результат человека – 266 360 баллов.