
Наличие способности находить короткий путь, самый прямой из точки «А» в точку «Б» не выглядит сегодня впечатляющим тестом разумности. Тем не менее, согласно новому отчету, который был опубликован в журнале Nature некоторое время назад, в котором исследователи рассказали о своей навигационной системе искусственного интеллекта, способность исследовать сложные симулированные пространства и находить кратчайший маршрут к цели, ставит системы такого рода на один уровень с человеком и другими животными.
Неожиданным ключом к нужной производительности оказалось то, что при обучении сеть спонтанно выращивала эквивалент «нейронов решетки» (grid cells) — некоторое множество клеток мозга, которое позволяет ряду млекопитающих отслеживать их положение в пространстве.
Для нейробиологов данная работа возможно подскажет важное связующее звено в понимании того, как нейроны решетки в живом мозге позволяют развивать навигационные способности. Работа также показывает, как нейронные сети могут оказать большое влияние на будущие исследования. Нил Берджесс, из Университетского колледжа Лондона, не принимавший участие в исследовании, предположил, что подобные системы должны «обеспечить плодотворную почву для понимания того, как и почему мозг работает именно таким образом».
Между тем, для исследователей в области искусственного интеллекта очевидна польза данной работы для улучшения автоматизированных навигационных систем. Но еще больший вклад это может внести в общие принципы понимания интеллекта и разработки интеллектуальных систем.
По мнению исследователей Андреа Банино из компании DeepMind и Касвелла Барри из Университетского колледжа Лондона, которые были основными авторами статьи в Nature, проект развился из вопроса о функции нейронов решетки, который они изучали. Нейроны решетки часто называют «GPS'ом мозга» из-за их важной роли в навигации многих животных. Эдвард Мозер и Мей-Бритт Мозер получили Нобелевскую премию в 2014 году, за их открытие девятью годами ранее. Эти кластеры нейронов, организованные в гексагональные массивы, в сумме дают результат подобный инерциальным системам навигации кораблей, самолетов и ракет — они дают понимание движений тела в пространстве даже в полной темноте. «Условно говоря, они обновляют ваш прогноз того где вы находитесь, основываясь на том как вы двигаетесь», добавил Барри.
Нейробиологи по этой причине приписывают нейронам решетки функцию «интеграции пути» — подсознательную интуитивную форму навигации, которая не учитывает внешние сигналы: к примеру, «сделать пять шагов вперед, повернуть на 90 градусов налево, и опять идти вперед еще 15 шагов». Но некоторые эксперименты давали подсказки, что эти нейроны выполняют и другие функции, даже выходящие за рамки навигации. К примеру, некоторые опыты показали участие этого типа нейронов в таких задачах как измерение времени и расстояния во время движения. Как отмечает Барри, если нейроны решетки обеспечивают пространственную привязку объектов и мест, то «в принципе вы можете использовать их для вычисления прямых маршрутов между этими точками», — то есть то что по сути называется «векторной навигацией».
Для изучения роли этих нейронов в задачах навигации, исследователи решили использовать нейронные сети с глубоким обучением. Чтобы понять как работает поиск пути, для начала они создали нейронную сеть для агента, который перемещается в небольшом симулированном пространстве. «Мы хотели понять, можем ли мы создать нейронную сеть таким образом, чтобы она сама начала развивать подобие нейронов решетки», сказал Барри.
Нейронная сеть справилась с задачей, и по словам Барри, «удивительно то, насколько хорошо она работала». В процессе работы спонтанно возникли «модули решетки» (grid units), которые поразительно были похожи на то что мы видим в мозге животных, вплоть до формата шестиугольной сетки.

Эти изображения показывают срабатывания живых и искусственных нейронов. Спонтанно возникшие в нейронной сети для навигационных задач модули решетки поразительно похожи на нейроны решетки в мозге, вплоть до их шестиугольной формы расположения.
Затем исследователи добавили системе способности нейронной сети, которые помогали симулированным агентам находить нужный путь к цели в виртуальном лабиринте. Система с модулями решетки на порядок превосходила аналогичную систему без них. К примеру, система могла понять, если закрытый до этого проход давал более короткий путь к цели и выбирать именно его. По словам Банино, это умение продемонстрировало, что модули решетки в нейронной сети обеспечивали векторную навигацию, поскольку обнаруживали более короткие и более прямые пути, основываясь на положении цели.
«Я думаю, что благодаря этой работе мы смогли доказать, как нейроны решетки испо��ьзуются для создания поиска кратчайшего пути», сказал Банино. Таким образом, результаты подтверждают теорию, что нейроны решетки в мозге способны выполнять как задачу интеграции пути, так и задачу векторной навигации. Сопоставимые экспериментальные доказательства в случае живых существ будет получить на порядок сложнее, добавил он.

В серии экспериментов по прохождению лабиринта, все тестируемые нейронные сети были в состоянии прийти к цели. Но если убирался один из барьеров, то только сеть с нейронами решетки распознавала это и выбирала такой путь как самый предпочтительный. Остальные системы продолжали выбирать любой из доступных маршрутов.
«Интересным выводом является то, что аналогичный подход может быть использован и для других задач нейронаук», отметил Барри. К примеру, исследователи размышляют над задачей управления конечностями. Нейронные сети можно было бы обучить управлению роботизированной рукой подобно тому как мозг управляет живой рукой, а потом провести серию экспериментов, которые могут дать важные подсказки о том, как эти процессы протекают в живых системах. «Этот подход потенциально может стать универсальным инструментом в области нейронаук».
«Это довольно впечатляющий результат», резюмировал Стефан Лойтгеб, профессор нейробиологии Калифорнийского университета в Сан-Диего. «Я думаю они нашли очень хороший аргумент в пользу того, что векторная навигация является функцией нейронов решетки. Длительное время это было лишь предположением, но я думаю они подобрались максимально близко к разгадке возможного механизма».
В то же время он заметил, что: «Любой вычислительный подход имеет свои ограничения. И то что это может работать на модели, не означает, что именно таким способом это работает у живых организмов».
Франческо Савелли, нейробиологи из Университета Джонса Хопкинса, который был со-автором комментариев, сопровождавших статью, имеет схожий взгляд. Он считает очень интересным, что «вы каким-то образом получаете нейроны решетки, не программируя их напрямую, но они все равно появляются в качестве самоорганизации». Но в то же время «поскольку это не точная биологическая система, вы не можете быть до конца уверены, какой именно вывод это дает».
«Пока вы не можете заглянуть в этот черный ящик, и сделать сеть чуть более похожей на биологическую, в какой-то момент вы упретесь в предел относительно нейробиологических исследований», сказал он.
С другой стороны, с технической точки зрения обнадеживает то что «эти системы глубокого обучения могут решать задачи, которые все больше и больше похожи на высшие когнитивные функции мозга», добавил Савелли. «Это хорошая демонстрация того, что глубокое обучение может распространяться в том числе на задачи подобные высшим когнитивным функциям».
Можно предположить, что исследователи из DeepMind будут стремиться использовать данную навигационную сеть для улучшения, скажем, способностей исследовательских роботов или будущих дронов-беспилотников. Но по словам Банино, их планы менее сфокусированные и более амбициозные. «Мы считаем, что навигация — это одно из фундаментальных свойств интеллекта», сказал он. «Лично мы не думает о каком-либо применении, кроме как создание универсального алгоритма».
«Мозг — это единственный пример универсального алгоритма», добавил он. «Так почему бы не поучиться у него».