Pull to refresh

Comments 19

Ух ты, мета-ИИ! Интересно, если их предположение правильно, и мозг человека работает подобным образом, какой уровень мета-*-ИИ нужен, чтобы объединить под одним "колпаком" достаточно нейросетей, чтобы получился ИИ, сопоставимый с человеческим?

разве существуют технологии объединения нейросетей?
Чтобы было А + В = С; а потом С — А = В. И каждая буква обозначает свою нейросеть.
Слышал только про вариант через переучивание.

Судя по описанию, здесь как раз каждый "агент" — отдельная нейросеть какого-то типа, а компонент, принимающий итоговое решение, тоже нейросеть. А вообще, вариант объединения сетей похож на управление своими желаниями: "Хочу поиграть в Пакмана! — Нет, ещё не отработал компонент "мытьё посуды", если прервать, получим по башке."

Чтобы было А + В = С; а потом С — А = В.
Гуглить «Bidirectional neural networks».
Вообще, техника сложения множества векторов — это вполне стандартный и известный алгоритм. Здесь было несколько отчетов авторов лучших решений на всяких ИИ контестах, и в большинстве игр использовался именно этот подход.
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
Жулики.
Запихнуть ИИ в корпус, поставить камеру(а еще лучше две — для стереоскопического зрения), пусть смотрит на экран, приделать манипуляторы, пусть жмет клавиши. Только после этого выпускать ставить рекорды
Судя по тому, что робот, собранный из Lego, собирает кубик Рубика значительно быстрее человека, особых трудностей с механическими интерфейсами возникнуть не должно.
Кубик анализируют только один раз, дальше все позиции известны, а тут непонятно куда приведение повернёт. И задержка джостика тоже внесёт нагрузку на расчёт времени поворота.

Это загрузит ИИ и он наберёт не 999 990 очков, а 999 989 очков :)

Даже решение кубика Рубика на специализированной микросхеме вряд ли можно выполнить быстрее, чем за наносекунду, реальнее говорить о десятке наносекунд.


Пикосекунда же пока недостижима. Все же стоит помнить, что под программными алгоритмами лежит вполне себе конкретное железо.

Интересно, можно его переучить с игры в Пакмана на написание дежурных статей для Хабра?
Так Ализар всё-таки белковый, а не кремниевый?
Не являюсь очень большим специалистом в плане ML, но я вот несколько раз прочитал их пейпер на Arxiv: https://arxiv.org/abs/1706.04208 пытаясь понять новизну метода.

Выходит они взяли Хорду, которую проф. Саттон предложил пару лет назад, и DQN на стероидах (V. Mnih & D. Silver @ DeepMind) и таким образом получили профит. Т.е. инновация в том, что они посто скомбинировали то, что до них не комбинировали? Саттон пилил Хорду без DQN используя более классические аппроксиматоры, а ребята из DeepMind использовали DQN без разделения велью и реворд функций? (Хотя, помню, читал их пейпер как они использовали много агентов A3C и мерджили результаты на сервере).
Что-то новое это почти всегда комбинация из чего-то что уже было.
Sign up to leave a comment.

Articles