ИИ научили играть в прятки, а он научился мухлевать / Habr

Команда из OpenAI, лаборатории искусственного интеллекта в Сан-Франциско, соучредителем которой является Илон Маск, научила играть ботов в прятки. Боты также узнали, как использовать базовые элементы окружающей их виртуальной среды и как игнорирование законов физики может помочь им победить.

В апреле команда ботов, известных как OpenAI Five, победила команду, состоящую из полупрофессиональных игроков и одного профи, в компьютерной игре DOTA2. Боуэн Бейкер из OpenAI и его коллеги хотели узнать, можно ли использовать командную динамику OpenAI Five для выработки навыков, которые однажды смогут быть полезны для людей.

«Трудно представить, как бот DOTA выходит из игры и решает реальные проблемы», — говорит он.

Исследователи вывели своих ботов в симулированную среду, заполненную неподвижными стенами и подвижными коробками, и оставили их играть в прятки миллионы раз. У каждого бота был свой «взгляд на мир», и они не могли напрямую общаться друг с другом.

Сначала боты, которые должны были прятаться, просто убежали. Но вскоре они выяснили, что самым быстрым способом ввести в заблуждение ботов-ловцов было найти объекты в окружающей среде, чтобы скрыться за ними. Например, они узнали, что ящики можно использовать для блокировки дверных проемов и создания простых укрытий.

Ловцы, в свою очередь, поняли, что они могут перелезать через стены. Затем боты обнаружили, что играть в команде — передавать объекты друг другу или сотрудничать в укрытии — это самый быстрый способ победить.

«Как только одна команда изучает новую стратегию, это создает давление на другую команду, — говорит Бейкер. — Это действительно интересный аналог того, как люди развивались на Земле в постоянной конкуренции с другими организмами».

Но настоящий сюрприз произошел, когда боты начали использовать баги в симуляции физики окружающей среды. Боты-ловцы обнаружили, что они могут подняться в воздух с помощью некоторых элементов среды и сверху разыскать прячущихся ботов. Вторые же поняли, что они могут избавиться от этих элементов, протолкнув их через наружные стены под определенным углом.

Такие трюки показывают, что ИИ способен находить решения, которые люди упускают, говорит Бейкер. «Может быть, они даже смогут решить проблемы, о которых люди еще не знают».