Pull to refresh

Усложнение памяти в нейросетях

Reading time4 min
Views2.2K
Читая статью «21 век: что такое жизнь с точки зрения физики» наткнулся на описание памяти как в живой так и не живой материи. Под памятью в живой материи все понимают, что имеется в виду, ну а под памятью в неживой подразумеваются все способы хранения информации в вашем компьютере и множество других способов. Итак, с точки зрения автора статьи Г. Иваницкого отличительной чертой жизни является использование памяти для прогнозирования Все бы хорошо, но только мы создали уже множество программ с прогнозированием и автоматов которые руководствуются такими программами. Мне не хочется поднимать как минимум несколько философских вопросов по поводу, где же граница живого и не живого, живые ли тогда роботы, а мы может просто сложные композитные автоматы и т.д. А просто вывести цепочку рассуждений к более интересующей меня проблеме, используя материал статьи.

Дарвин предполагал, что движущей силой эволюции является наследственность, отбор и изменчивость. Однако отбор не может быть движущей силой, он происходит из того, что уже существует, уменьшая разнообразие. Отбор это операция редукции. А вместо термина «изменчивости» следовало бы использовать термин «самоусложнение». Но как реализуется механизм самоусложнения?

Как и для любого процесса для усложнения необходима энергия и направляющая использования этой энергии. Автор не дает прямого ответа, что и как здесь должно происходить. Он проводит максимально приближенную на его взгляд к данному процессу аналогию. Как из случайного симметричного хаотического процесса возникает направленный процесс и накопление энергии. Почему симметричный хаотический процесс, потому что возникновение жизни рассматривается на молекулярном уровне в жидкости, характеризующейся термодинамическим равновесием. А для простоты и наглядности объяснения симметричный хаотический процесс сводится до вероятностной двоичной игры.

А вероятностная двоичная игра это простое подбрасывание монетки. Такая игра симметрична, для бесконечного количества бросков средние вероятности выигрыша и проигрыша равны. Вопрос состоит в том, может ли игрок каким либо способом нарушить симметрию в свою сторону?
Условия игры довольно строги, каждый раз, когда подбрасывается монета, игра начинается снова, все предыдущие результаты игр забыты. Вероятность каждой новой игры не зависит от предыдущей. Это означает, что не существует стратегии позволяющей выиграть, а оптимальная стратегия, противопоставление случайности выпадения одной из сторон монеты полностью случайной стратегии угадывания стороны, гарантирует ничью.

Тем не менее, если игрок будет обладать памятью хотя бы на один раунд и возможностью изменять величину ставки, то можно выбрать такую стратегию изменения величины ставки, которая привносит асимметрию в сторону игрока. При рассмотрении результатов игр во времени их можно представить, как последовательность чередующихся кластеров выигрышей и проигрышей различной длинны. Стратегия заключается в увеличении ставки с единицы по арифметической прогрессии, как только вы выиграли. В общей сумме после применения такой стратегии кластеры выигрышей будут приносить больше, чем будут забирать кластеры проигрышей.

Такая стратегия это простейший пример системы управления с переменным коэффициентом обратной связи. В нашем случае стратегию придумал игрок, как это случилось в природе неизвестно. Но очевидно, что центральной идеей всех живых объектов есть стратегия выживания, требующая наличия системы управления. В живых организмах такие системы реализованы как на молекулярном уровне у одноклеточных, так и на клеточном уровне – на нейронах в нервной системе высших форм жизни.

Вышеописанная система управления обладает памятью используемой для хранения результата последней игры в подбрасывание монеты. С каждой новой игрой ячейка памяти обновляет свое значение. Такая память основана на простой структуре и легко реализуема на нейросетях, но все же она держится ровно один такт работы. И это возможно был первый шаг природы в эволюции систем управления жизнью.

Сейчас самым сложным продуктом эволюции является человеческий мозг, состоящий из множества нейронов. Нейроны и связи между нейронами очень, очень сложно структурированы. До сих пор уточняется и совершенствуется карта мозга, описывающая какие есть структурные участки мозга и за что они отвечают. И нам далеко даже до составления «коннекто́ма» мозга человека — полного описания структуры связей в нервной системе организма.

Но одним из важных свойств человеческого мозга является «постоянная память», позволяющая обучиться и реализовывать вышеописанную и подобные ей стратегии без владения ими с рождения. Логично было бы предположить, что вытворять такие фокусы нам позволяет структура нашего мозга. И вот если максимально отбросить все усложняющие свойства и поставить перед собой задачу создать модель системы управления, структура которой позволяла бы удерживать в памяти простейшую стратегию и одновременно руководствоваться ею. (Меня пробивает на жесткую аналогию с выражением «система осознает что делает») Сможем ли мы решить такую задачу на нейронах? Как таковое решение уже существует, но в виде экспертных систем, программ выводящих новые теоремы и им подобных, но не на нейронах. И я не слышал, что бы кто-то серьезно занимался построением таких структур на нейросетях. Последние серьезные попытки работать со сложными структурами нейронов это реализация нервной системы простейшего круглого червя по коннектому. Но в черве нет структуры «постоянной» памяти, это свойство есть только у более высших форм жизни. Или же с моей точки зрения слабо осознанное моделирование одновременной работы нейронов количеством немногим более чем у обычной кошки.

У меня есть статья, про то как я моделировал на нейросети систему управления простой амебы, которая идет к цели. Сейчас же я хочу построить управляющую структуру на нейронах, которая бы отвечала следующим требованиям:
  • амеба, попадая в комнату с двумя ориентирами произвольно гуляя по комнате, натыкается на скрытую еду и расположенную случайным образом относительно ориентиров.
  • далее амеба попадает в другую комнату без указанных выше ориентиров, но с любыми другими.
  • далее амеба вновь попадает в первую комнату и первым делом идет на старое место, где она нашла еду.

Из своего предыдущего опыта могу сказать, что наверно задача будет упрощена еще больше до самого примитивного уровня с сохранением центральной идеи реализовать «постоянную» память. Ну а результат будет в виде еще одного способа как это не работает.

Материалы:
Статья «21 век: что такое жизнь с точки зрения физики » Г.Р. Иваницкий в журнале «Успехи физических наук».
Видео программа «Популярная наука» с обсуждением статьи.
Tags:
Hubs:
Total votes 14: ↑8 and ↓6+2
Comments51

Articles