marks Jun 15 2017 at 09:05

ИИ от Microsoft побил рекорд, поставленный человеком в Ms. Pac-Man

3 min

13K

Artificial IntelligenceGames and game consoles

+13

Comments 19

vesper-bot Jun 15 2017 at 09:39

Ух ты, мета-ИИ! Интересно, если их предположение правильно, и мозг человека работает подобным образом, какой уровень мета-*-ИИ нужен, чтобы объединить под одним "колпаком" достаточно нейросетей, чтобы получился ИИ, сопоставимый с человеческим?

IvanTamerlan Jun 15 2017 at 12:34

разве существуют технологии объединения нейросетей?
Чтобы было А + В = С; а потом С — А = В. И каждая буква обозначает свою нейросеть.
Слышал только про вариант через переучивание.

vesper-bot Jun 15 2017 at 14:35

Судя по описанию, здесь как раз каждый "агент" — отдельная нейросеть какого-то типа, а компонент, принимающий итоговое решение, тоже нейросеть. А вообще, вариант объединения сетей похож на управление своими желаниями: "Хочу поиграть в Пакмана! — Нет, ещё не отработал компонент "мытьё посуды", если прервать, получим по башке."

Sadler Jun 15 2017 at 16:59

Чтобы было А + В = С; а потом С — А = В.

Гуглить «Bidirectional neural networks».

daiver19 Jun 15 2017 at 18:56

Вообще, техника сложения множества векторов — это вполне стандартный и известный алгоритм. Здесь было несколько отчетов авторов лучших решений на всяких ИИ контестах, и в большинстве игр использовался именно этот подход.

UFO landed and left these words here

CrazyRoot Jun 15 2017 at 10:37

Жулики.
Запихнуть ИИ в корпус, поставить камеру(а еще лучше две — для стереоскопического зрения), пусть смотрит на экран, приделать манипуляторы, пусть жмет клавиши. Только после этого выпускать ставить рекорды

RomanArzumanyan Jun 15 2017 at 12:01

Судя по тому, что робот, собранный из Lego, собирает кубик Рубика значительно быстрее человека, особых трудностей с механическими интерфейсами возникнуть не должно.

Igor_34_rus Jun 15 2017 at 12:57

Кубик анализируют только один раз, дальше все позиции известны, а тут непонятно куда приведение повернёт. И задержка джостика тоже внесёт нагрузку на расчёт времени поворота.

Это загрузит ИИ и он наберёт не 999 990 очков, а 999 989 очков :)

Boctopr Jun 15 2017 at 13:00

Вот только программный кубик Рубика он соберет за пикосекунду.

tnenergy Jun 15 2017 at 14:28

Даже решение кубика Рубика на специализированной микросхеме вряд ли можно выполнить быстрее, чем за наносекунду, реальнее говорить о десятке наносекунд.

Пикосекунда же пока недостижима. Все же стоит помнить, что под программными алгоритмами лежит вполне себе конкретное железо.

lisovsky1 Jun 15 2017 at 18:18

Скоро ИИ стримить начнёт.

old_bear Jun 15 2017 at 19:53

Интересно, можно его переучить с игры в Пакмана на написание дежурных статей для Хабра?

aszhitarev Jun 16 2017 at 05:40

Так Ализар всё-таки белковый, а не кремниевый?

henk Jun 16 2017 at 02:18

Не являюсь очень большим специалистом в плане ML, но я вот несколько раз прочитал их пейпер на Arxiv: https://arxiv.org/abs/1706.04208 пытаясь понять новизну метода.

Выходит они взяли Хорду, которую проф. Саттон предложил пару лет назад, и DQN на стероидах (V. Mnih & D. Silver @ DeepMind) и таким образом получили профит. Т.е. инновация в том, что они посто скомбинировали то, что до них не комбинировали? Саттон пилил Хорду без DQN используя более классические аппроксиматоры, а ребята из DeepMind использовали DQN без разделения велью и реворд функций? (Хотя, помню, читал их пейпер как они использовали много агентов A3C и мерджили результаты на сервере).

artemev Jun 18 2017 at 20:58

Что-то новое это почти всегда комбинация из чего-то что уже было.