
Комментарии 5
мыслительный процесс человеческого мозга значительно стандартных компьютеров
Значительно... что?
Натянуто прям сильно. Это сильное преувеличение (оверхайп).
Штука просто "стреляет" постоянно - это не значит, что "научили". Демонстрируют коротенький зацикленный фрагмент, где эта хаотическая "стрельба" попадает во врагов.
Да и с предыдущей "игрой" в пинг-понг - тоже натянуто, там "ракетка" чуть ли не 2/3 экрана и просто хаотично дёргается посередине, да, что-то будет попадать в неё, но это не значит, что "нейроны в чашке Петри играют в понг".
Ну и к "обучению" есть вопросы, лень ковырять их папиры (если такие есть), но я не могу представить как эти живые нейроны "поощрять" для обучения методом подкрепления? Нежные поглаживания, сладкая газировка? Лёгкое гугление показало, что поощряют упорядоченным сигналом, а наказывают хаотичным.
В общем критикую, притянуто за уши, даже у случайного генератора, если наснимать много видео, наверняка найдется несколько коротких моментов (как нам показывают), когда "успешно отбивает мяч, стреляет во врагов во все стороны". Но от этого разумности там нет.
Но от этого разумности там нет.
К чему такой скепсис, если иметь в виду результаты этих исследований? Это фактически те же нейроны, что и у человека в мозге, с помощью которых люди успешно играют в эти игры. Только их намного меньше, в мозге их ~ 100 миллиардов разных типов. Получается условно ~10^-5 разума человека) Или, как "разум" муравья. Однако в мозге человека они с рождения организованы в иерархическую рекуррентную сеть, а не в виде однородной культуры. Также пока большие проблемы с точностью интерфейса связи с оборудованием и отображением состояния игр, как отмечают сами авторы. Эти опыты, в первую очередь, направлены на изучение самоорганизации нейронных сетей в рамках вариационного принципа минимизации свободной энергии, см. этот комент. По современным когнитивным представлениям это общий принцип функционирования нейронных сетей, включая всю нервную систему (в теории предиктивного кодирования, байесовского мозга/разума - обзор). Из этого принципа в пределе ИНС из формальных нейронов выводится процедура обратного распространения ошибок, которая используется для их обучения. Однако биологические нейронные сети, в отличии от искусственных, могут "на лету" не только менять веса синапсов, но и создавать новые синапсы или деактивировать мало используемые, вносящие шум, т.е. динамически перестраивать свою архитектуру под решение новых задач в соответствии с их организацией (проводить обобщения и аналогии, строить модели задач). В мозге такая перестройка структуры сетей (морфогенез) фактически отвечает за решение творческих задач. Возможность которая пока отсутствует в ИНС с их статичной архитектурой и настройкой весов после обучения. В этом смысле "разумность" таких ветвэа решений теоретически может превосходить возможности ИИ на основе трансформеров. С формальной точки зрения ЯМ являются приближенными моделями биологических прототипов в виде стохастических авторегрессионных аппроксиматоров обученных на ограниченных выборках данных. С когнитивной точки зрения первые обладают некоторыми свойствами полноценного разума, а вторые только относительно достоверно эмитируют его интеллектуальные функции. Они не строят фактических моделей задач с учетом их внутренней организации, а только ассоциативные в соответствии с имеющимися связями в данных по ним в обучающей выборке и дополняют аппроксимацией недостающие. Поэтому могут выдавать ошибки в решениях получившие название "галлюцинаций" ЯМ. По этим причинам ИНС могут решать только подкласс творческих задач на которые способны биологические сети, но превосходят их в решении задач с известными алгоритмами и большими пространствами решений таких, как расчет фолдинга биомолекул или игры в шахматы.
Да и с предыдущей "игрой" в пинг-понг - тоже натянуто, там "ракетка" чуть ли не 2/3 экрана и просто хаотично дёргается посередине, да, что-то будет попадать в неё, но это не значит, что "нейроны в чашке Петри играют в понг".
Ну и к "обучению" есть вопросы, лень ковырять их папиры (если такие есть)
Посмотреть статистику по обучению пинг-понгу можно в этой статье (окончательный вариант с большим число графиков данных). В ней приводятся величины корреляций и таблица уровней значимости для всех измерений. Эффект обучения имеется и он не на уровне шума. Выявляется не только в самой игре, но и в динамике нейронной активности в разных режимах - смены игры/отдыха, обучения на случайны и не случайных стимулах, и др.
Подобные исследования полезны в рамках разработки нейроморфных решений, которые со временем обязательно будут востребованы из-за их чрезвычайной энергоэффективности и других преимуществ. С учетом того, что как заявляют многие известные личности в области МО, технология ЯМ находится на грани исчерпания своих возможностей. Соответственно активизируется поиск решений, как в русле самой технологии, так и на новой основе, такой, как моделей мира Яном Лекуном или обучения с подкреплением непосредственно в среде Д. Сильвером, деньги на это выделяются. Эти идеи лежат в русле исследований из статьи, предполагающих новый уровень агентности ИИ.
«Биологический компьютер» на основе клеток мозга научили играть в Doom