Comments 19
Ух ты, мета-ИИ! Интересно, если их предположение правильно, и мозг человека работает подобным образом, какой уровень мета-*-ИИ нужен, чтобы объединить под одним "колпаком" достаточно нейросетей, чтобы получился ИИ, сопоставимый с человеческим?
0
разве существуют технологии объединения нейросетей?
Чтобы было А + В = С; а потом С — А = В. И каждая буква обозначает свою нейросеть.
Слышал только про вариант через переучивание.
Чтобы было А + В = С; а потом С — А = В. И каждая буква обозначает свою нейросеть.
Слышал только про вариант через переучивание.
0
Судя по описанию, здесь как раз каждый "агент" — отдельная нейросеть какого-то типа, а компонент, принимающий итоговое решение, тоже нейросеть. А вообще, вариант объединения сетей похож на управление своими желаниями: "Хочу поиграть в Пакмана! — Нет, ещё не отработал компонент "мытьё посуды", если прервать, получим по башке."
+1
Чтобы было А + В = С; а потом С — А = В.Гуглить «Bidirectional neural networks».
0
Вообще, техника сложения множества векторов — это вполне стандартный и известный алгоритм. Здесь было несколько отчетов авторов лучших решений на всяких ИИ контестах, и в большинстве игр использовался именно этот подход.
0
UFO just landed and posted this here
Жулики.
Запихнуть ИИ в корпус, поставить камеру(а еще лучше две — для стереоскопического зрения), пусть смотрит на экран, приделать манипуляторы, пусть жмет клавиши. Только после этого выпускать ставить рекорды
Запихнуть ИИ в корпус, поставить камеру(а еще лучше две — для стереоскопического зрения), пусть смотрит на экран, приделать манипуляторы, пусть жмет клавиши. Только после этого выпускать ставить рекорды
+7
Судя по тому, что робот, собранный из Lego, собирает кубик Рубика значительно быстрее человека, особых трудностей с механическими интерфейсами возникнуть не должно.
+1
Кубик анализируют только один раз, дальше все позиции известны, а тут непонятно куда приведение повернёт. И задержка джостика тоже внесёт нагрузку на расчёт времени поворота.
Это загрузит ИИ и он наберёт не 999 990 очков, а 999 989 очков :)
Это загрузит ИИ и он наберёт не 999 990 очков, а 999 989 очков :)
+1
Вот только программный кубик Рубика он соберет за пикосекунду.
+2
Скоро ИИ стримить начнёт.
+3
Интересно, можно его переучить с игры в Пакмана на написание дежурных статей для Хабра?
+2
Не являюсь очень большим специалистом в плане ML, но я вот несколько раз прочитал их пейпер на Arxiv: https://arxiv.org/abs/1706.04208 пытаясь понять новизну метода.
Выходит они взяли Хорду, которую проф. Саттон предложил пару лет назад, и DQN на стероидах (V. Mnih & D. Silver @ DeepMind) и таким образом получили профит. Т.е. инновация в том, что они посто скомбинировали то, что до них не комбинировали? Саттон пилил Хорду без DQN используя более классические аппроксиматоры, а ребята из DeepMind использовали DQN без разделения велью и реворд функций? (Хотя, помню, читал их пейпер как они использовали много агентов A3C и мерджили результаты на сервере).
Выходит они взяли Хорду, которую проф. Саттон предложил пару лет назад, и DQN на стероидах (V. Mnih & D. Silver @ DeepMind) и таким образом получили профит. Т.е. инновация в том, что они посто скомбинировали то, что до них не комбинировали? Саттон пилил Хорду без DQN используя более классические аппроксиматоры, а ребята из DeepMind использовали DQN без разделения велью и реворд функций? (Хотя, помню, читал их пейпер как они использовали много агентов A3C и мерджили результаты на сервере).
0
Sign up to leave a comment.
ИИ от Microsoft побил рекорд, поставленный человеком в Ms. Pac-Man