Нейронные сети, основанные на гомеостатических нейронах: самоорганизация и целенаправленное поведение

    Введение


    В данном топике я хочу рассказать о модели необычной нейронной сети, в разработке которой мне посчастливилось участвовать. Данная модель была разработана около года назад (про авторство написано в последнем разделе), однако исследование ее после этого прекратились из-за совершенной нехватки времени (занятости в своих собственных проектах). Тем не менее я опишу ее здесь в надежде на то, что некоторые мысли покажутся читателям интересными и дадут ростки возможных дальнейших исследований в данном направлении.

    Сразу оговорюсь, что эта модель не претендует никоим образом на прототип ИИ. Мы скорее хотели исследовать возможность самоорганизации и перспективы возникновения целостного целенаправленного поведения в динамической системе «эгоистичных» (гомеостатических) нейронов.
    Как мне кажется, для более полного понимания логики работы модели будет полезно прочитать мой топик про Теорию функциональных систем, однако опять же это на ваше усмотрение.

    Поехали!


    Биологическое основание


    Данная модель строилось на основании теории функциональных систем П.К. Анохина и теории гомеостаза.

    Гомеостаз — саморегуляция, способность открытой системы сохранять постоянство своего внутреннего состояния посредством скоординированных реакций, направленных на поддержание динамического равновесия. Уолтер Кэнон, который изначально ввел этот термин, называл гомеостаз «мудростью тела» [1].

    Простейшие биологические мотивации возникают при нарушении гомеостатического равновесия в нейронах соответствующих физиологических зон (нарушение запасов энергии, кислорода или осмотический дисбаланс). Тем не менее, существует некая универсальная единица для оценки биологической мотивации [2]. Существование этой единицы связано с тем, что удовлетворение любой мотивации вызывает удовольствие и, соответственно, удаление дисбаланса в гомеостатической системе, который и порождает данную мотивацию. Поэтому моделирование гомеостаза – это прямой путь к созданию искусственной системы, обладающей некоторым подобием мотивации, т.е. системы, имеющую собственную цель и пути к ее достижению. Есть множество факторов, ведущих к рассогласованию в системе гомеостаза, причем наблюдается иерархия таких факторов, по степени их важности для выживания клетки. Для сохранения факторов высшего уровня в стабильном диапазоне гомеостаз изменяет оптимальные уровни регулирования факторов нижнего уровня. Т.е. восстановление функции может происходить не через возвращение искаженных параметров к норме, а обходным путем, через изменения соотношения между этими параметрами. В частности, избыточное возбуждение повреждает нейроны, но есть некоторые факторы, восстанавливающие гомеостаз (как цАМФ, Интерлейкин-1, тиротропин-выделяющий гормон). Следовательно, компенсационный гомеостаз может на промежуточном этапе возбуждать нейроны на пути к поиску новой точки равновесия. На рис. 1. изображена схема двухуровневого гомеостаза в нейроне. Красным цветом на рисунке условно показано повреждение нейрона, а зеленым – восстановление. Повреждение – это внешний фактор, порождающий рассогласование.

    image
    Рис. 1. Гомеостаз нейрона
    (LoR – гомеостаз низкого уровня, HoR – гомеостаз высокого уровня, LS – локальный сенсор рассогласования, R – награда снижающая уровень рассогласования)


    В литературе известен набор моделей гомеостаза [3,4], но они не ориентированы на самоорганизацию нейронных сетей и целенаправленное поведение. Моделирование целенаправленного поведения, в том числе на основе нейронных сетей и обучения с подкреплением, также имеет богатую историю и широко освещена в литературе. Однако в рамках этих моделей не рассматривался гомеостаз нейронов и сетей в целом.

    Собственно, исходя из всего вышесказанного, была сформулировано иерархия моделей, которые составят полную систему:
    — модель гомеостатического нейрона, объединяющая ключевые характеристики известных моделей и основные принципы рассматриваемой парадигмы;
    — модели гомеостатической нейронной сети, основанной на гомеостатических нейронах;
    — модель простейшего организма, управляемого гомеостатической нейронной сетью, и его взаимодействия со средой;
    — моделирование эволюционного развития простейших организмов в условиях изменяющейся внешней среды.

    Модель гомеостатического нейрона и нейронной сети


    Так как основной задачей является анализ парадигмы гомеостатического нейрона как возможной основы механизма самоорганизации нейронной сети и ее способности к автономному поведению, то особенное внимание необходимо уделить именно этой ключевой первичной модели. Модель гомеостатического нейрона подразумевает, что каждый нейрон стремится к поддержанию своего оптимального внутреннего состояния – гомеостаза, причем при рассогласовании текущего состояния с оптимальным, нейрон формирует ответ, направленный на возвращение к оптимальному состоянию. Как уже упоминалось ранее изменение множества факторов может привести к нарушению равновесия нейрона, однако в модельной ситуации введем некоторую единую эндогенную оценку состояния нейрона q(t), имеющую предопределённое оптимальное значение qopt. Также введем показатель величины внутренней энергии e(t), отражающий возможности нейрона по генерации сигналов x(t) и поддержанию гомеостаза собственной активности.

    Стремление нейрона к гомеостазу выражается в активности, направленной на устранение рассогласования qopt-q(t), тем более выраженной, чем больше величина рассогласования. Активность нейрона требует энергетических затрат, поэтому может принимать разные формы в зависимости от количества имеющейся энергии e(t).

    Таким образом, мы сформулировали некоторые требования к модели «эгоистического» нейрона, т.е. такого нейрона который имеет одну цель – поддерживать свое состояние близкое к оптимальному. Однако, каждый нейрон не может существовать изолировано, а обязан функционировать в целостной нейронной сети. Таким образом, мы можем ввести понятие вектора воздействия на конкретный нейрон со стороны остальной сети:
    image
    Это воздействие меняет эндогенную оценку нейрона на следующий такт времени:
    image
    Данная функция может выглядеть по разному, однако самый просто ее случай – это
    image

    Получается, что выше мы ввели все характеристики нейрона, а также методику определения воздейтсвия на нейрон со стороны остальных нейронов. Теперь мы введем понятие рассогласования нейрона g(t), смысл которого мы уже касались выше, а также собственно понятие действия нейрона и выходного сигнала. Рассогласование нейрона:
    image
    Теперь определим действие нейрона, которое он выбирает на основе текущего рассогласования:
    image

    На этом этапе необходимо остановится подробнее, так как с одной стороны он является одним из ключевых во всей модели, а с другой стороны само понятие действия аккумулирует в себе несколько биологических принципов и наших размышлений, о которых было сказано выше.

    Первое, что необходимо заметить – это то, что любое воздействие на нейрон со стороны других нейронов влечет к отклонению от его гомеостатического равновесию. Соответственно все действия нашего «эгоистичного» нейрона должны быть направлены на возвращение к этому равновесию. В этом заключается принцип гомеостаза низкого уровня. Тут возможны несколько случаев, которые собственно и были рассмотрены при составлении функции действия.

    Действие нейрона в первую очередь зависит от степени его рассогласованности. Если нейрон находится далеко от точки гомеостатического равновесия, то он осуществляет действие, которое немедленно возвращает его к равновесию – генерацию спайка. Если же он близок к равновесию, то включается другой механизм гомеостаза – медленное восстановление. На каждое действие нейрон тратит энергию: на спайк – большую, а на восстановление – не очень большую. Про пополнение энергии нейрона будет рассказано далее.

    Кроме этого энергии нейрона может не хватить на генерацию спайка, даже когда он необходим, что означает выбор восстановление до того момента, пока энергия не пополнится.

    Таким образом, действие нейрона является функцией от входного сигнала, эндогенной оценки состояния и запаса энергии. Собственно на этом заканчивается формальная модель нейрона (в том числе гомеостаза нижнего уровня) и сети в целом. На рис. 2 приведено схематическое изображение «эгоистического» нейрона.

    image
    Рис. 2. «Эгоистичный» нейрон

    Модель организма


    Нейронная сеть является частью целого организма, однако для его полного определения необходимо ввести еще несколько дополнительных понятий. Первое из них – это общий пул энергии Е(t), из которого восстанавливаются энергии всех нейронов сети. Если e(t)<emin (оптимальный запас энергии нейрона), то
    image
    Теперь нам необходимо определить понятие гомеостаза высшего уровня.
    Введем понятие эндогенной оценки состояния всей сети:
    image
    При это будем считать, что есть некоторое оптимальное состояние Qopt:
    image
    Тогда определимся, что гомеостаз высшего уровня вступает в действие в двух различных случаях:
    — после установления стабильности (в случае если в сети наблюдается циклический процесс, но состояние не достигает оптимального значения)
    — при «возникновении потребности» (в случае большого рассогласования эндогенной оценки состояния сети)

    В этом случае происходит изменение параметров qiopt случайным образом, при этом величина изменения каждого значения пропорциональна, как рассогласованию эндогенной оценки состояния сети, так и рассогласованию эндогенной оценки конкретного нейрона. Таким образом, при невозможности системы достичь оптимального состояния и при угрозе жизни всей сети, включается механизм гомеостаза высшего уровня. Cхематично такая модель организма показана на рис. 3.

    image
    Рис. 3. Модель организма

    Здесь, наверное необходимо привести некоторые экспериментальные данные, по которым можно будет судить о качественной динамики такой модели (без гомеостаза высшего уровня). Мы составили сеть из 10 нейронов со случайно распределенными весами по распределению Wij~N(0,1) и с различными оптимальными значениями эндогенной оценки состояния и запаса энергии. При этом на момент инициализации 9 нейронов находились в состоянии равновесия, а один из нейронов был рассогласован. На рис. 4-5 приведены зависимости от времени эндогенной оценки состояния и энергии каждого нейрона в такой системе.

    image
    Рис. 4. График динамики эндогенной оценки состояния нейронов

    image
    Рис. 5. График динамики запаса энергии нейронов

    По рисункам видно, что в итоге вся система приходит в положение гомеостатического равновесия, однако наши опыты показывают, что существует область параметров, при которых достижение гомеостатического равновесия невозможно и в системе начинается автоколебательный процесс, что свидетельствует о необходимости включения гомеостаза высшего уровня.

    Взаимодействие со средой


    Представим себе, что мы помещаем такой организм в среду. Предположим, что у нашего организма всего одна потребность – потребность в поддержании достаточного уровня общей энергии, которая расходуется на гомеостаз и на метаболические процессы. В таком случае необходимо, чтобы организм мог принимать решение в нужный момент о восполнении уровня энергии. То есть, например нажимать на кнопку, чтобы ему подавалась еда.

    Мы думали о введение макропараметров организма, изменение которых определяет его потребности (их может быть несколько), а также о рассмотрение набора эффекторов, позволяющих организму изменять значения своих макропараметров за счет взаимодействия с внешней средой. В основе предлагаемого подхода к проблеме лежит передача информации о значениях макропараметров непосредственно гомеостатическим нейронам, что связывает внутренний гомеостаз нейрона с удовлетворением соответствующей потребности. Таким образом, гомеостаз второго уровня отвечает за работоспособность системы в целом, а первого уровня – за эффективную линию поведения организма при взаимодействии с окружающей средой.

    Поясню на примере. Для этого предположим, что в структуре нейронной сети присутствует два специализированных нейрона.

    Первый нейрон специализирован относительно потребности в восполнении энергии, то есть он вступает в рассогласование в случае, если уровень общей энергии недостаточен. То есть у него есть дополнительный вход, на который поступает уровень недостатка общей энергии ( E-Emin). Второй нейрон специализирован относительно выполнения действия восполнения энергии, то есть в тот момент, когда он генерирует спайк происходит восполнение общей энергии из внешней среды. Данная система изображена на рис. 6.

    image
    Рис. 6. Взаимодействие организма со средой
    красный нейрон специализирован относительно потребности в восполнении энергии, синий — относительно выполнения действия восполнения энергии)


    Таким образом, рассогласование в организм вносится в тот момент, когда он испытывает потребность в еде. В свою очередь нейроны пытаются устранить это рассогласование. Пока не будет наблюдаться спайк на нейроне специализированном относительно выполнения действия, восполнение энергии не произойдет, и сигнал о недостатке энергии будет продолжать поступать в систему. Таким образом, в какой-то момент спайк генерируется на втором специализированном нейроне и запас общей энергии пополняется, из-за чего нейрон, который специализирован относительно потребности в восполнении энергии перестает быть рассогласованным.

    Безусловно это очень модельная ситуация, однако она показывает по какой логике может функционировать такой организм в среде, где требуется принимать некоторые решения.

    Непрерывная модель


    Исключительно для тех, кто задумается о том, как можно эту дискретную во времени модель сделать непрерывной, привожу наш вариант, основанный на модели нейронов ФитцХью-Нагумо.
    image

    Заключение


    Безусловно данная модель не может претендовать на хоть какую-то законченность. Однако, мне кажется, что некоторые мысли в нее заложенные, достаточно интересны и могут стать объектом исследования читателей. В частности идея рассогласования нейрона, как мотивации для совершения действия, определение рассогласования – как соотношения внутренних параметров нейрона с микросредой, а также гомеостаз – как основа для устранения рассогласования и для самоорганизуещего эффекта.

    Также этим топиком я хотел обратить внимание читателей на то, что даже в достаточно простых моделях могут возникать интересные эффекты самоорганизации, которые в перспективе могут приводит к целостному поведению.

    Отмечу, что в данном обзоре я не касался нетривиального вопроса введения процесса обучения в эту модель, а также собственно эволюции. Все это остается предметом дальнейших возможных исследований.

    Авторство


    В разработке данной модели принимали участие Максим Комаров (Нижегородский университет), Даниил Каневский (ВМиК МГУ), Сергей Куливец (ИПУ РАН), а также ваш покорный слуга. Также огромной благодарности заслуживают Лев Ефимович Цитоловский (Бар-Иланский Университет, Израиль) и Владимир Георгиевич Редько (НИИСИ РАН) за их поддержку и слежение за направлением наших мыслей, когда нас заносило. Каждый из нас привнес в эту модель свои мысли и соображения из областей, которыми мы занимаемся.

    Список литературы


    [1]. Cannon W. B. Physical Review, 1928, 9:399-431.
    [2]. Cabanac M. Journal of Theoretical Biology, 1992, 155:173-200.
    [3]. Davis G.W. Annual Review of Neuroscience, 29:307-323, 2006.
    [4]. Marder A., Prinz A. A. BioEssays, 24: 1145-1154, 2002
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 34

      –1
      Интересная статья, спасибо.
        0
        «Отмечу, что в данном обзоре я не касался нетривиального вопроса введения процесса обучения в эту модель, а также собственно эволюции. Все это остается предметом дальнейших возможных исследований.»
        на самом интересном месте :)
          +1
          Возможные пути решения вопроса обучения и эволюции с помощью теории функциональных систем и системно-эволюционной теории будут в моих следующих топиках.=)) Правда с использованием другой модели.
        • НЛО прилетело и опубликовало эту надпись здесь
            0
            Отличное направление выбрали для работы. Молодцы. Спасибо за статью.
              –1
              А как вам такое приложение — проанализировать Хабр (или любую соц. сеть) как набор «эгоистичных нейронов» и дать рекомендации по их «обучению» :-)
                0
                Мой мозг взорван.
                  +2
                  А такие нейроны вообще способны выполнять какую-то работу кроме установления собственного гомеостаза? Можно просто осветить направление работы нейросети из таких нейронов над решением какойто реальной задачи? Как вы это представляете?
                    +2
                    Там в топике в разделе модель организма приведена очень модельная ситуация про пополнение энергетического ресурса.
                    Такая нейросеть изначально нами задумывалась как управляющая поведением, поэтому было введено понятие сенсорных нейронов (которые зависят от значения макропараметров — например уровня голода), а также эффекторных нейронов, которые собственно отвечают за действия. И в такой постановке задачи именно установление собственного гомеостаза и приводит к какому-то конкретному поведению в среде. Мы хотели показать именно то, что сеть состоящая из нейронов, каждый из которых действует как отдельных эгоистичный организм, может в общем приводить к целенаправленному поведению.
                    Если вы спрашиваете про возможность ее применения в прикладных задачах обработки информации, то над этим я не думал, но мне кажется, что это тоже возможно, однако нужно что-то менять или как-то по другому интерпретировать.
                      +2
                      Точнее не в разделе про модель организма, а в разделе про взаимодействие со средой.
                      0
                      Это и есть нейронные сети, которые учатся без учителя, о которых Вы говорили ранее? ;)
                        0
                        а когда будет про обратные связи, задержки и циклы в нейронных сетях, обработка данных во времени…?
                          +2
                          А я разве про это обещал?=))
                          А обратные связи и задержки — это Вы имеете ввиду рекуррентные сети? Так там собственно в основах сеть Джордана и сеть Элмера. Ими конечно никто уже не пользуется, но ничего особого нового не изобрели, так как иначе если мы работаем в дискретном времени, то у нас будут проблемы с устойчивостью по-любому. Если же мы работаем в непрерывном времени, то там этот вопрос вообще особо не встает.

                          Но впринципе если Вы обозначите какую-то конкретную тему и, с одной стороны, я в ней буду разбираться и буду считать, что она интересная, а с другой стороны она покажется интересной другим, то я готов составить обзор или критический анализ.
                          +2
                          Пока нет.=) Та модель гораздо сложнее и там больше уровней, поэтому я сейчас думаю над тем как бы ее описать, чтобы у всех окончательно не взорвался.=) но перед этим я думаю будет еще один топик про компьютерное зрение с использованием нейронных сетей и спектральных признаков.
                          Но между прочим для этой сети как ни для какой другой можно попытаться сформулировать правила самообучения на основе самоорганизации.
                            +1
                            Кстати, не забывай приводить в статье больше примеров из реальной жизни. А-то много формальной математики — я, например, гораздо лучше думаю на основе примеров (визуальное мышление, все дела, приходится тратить ресурсы на поиск примеров удовлетворяющих формуле и т. д. :) ).
                              +2
                              Это разница восприятия и воспитания. =) Мне, например, наоборот тяжело читать здесь посты про некоторые модели, которые написаны исключительно словами — очень сложно выделить в них суть и понять формальную модель.
                              Вот математическая модель — другое дело. Сама формализация все говорит о себе — остается только добавить основание по которому она была сделана.
                              А вообще я вроде стараюсь объяснять каждую формула, откуда она такая взялась. Но все равно спасибо за наблюдение, feedback всегда полезен.
                            0
                            Очень интересные мысли. Если будет развитие этой идеи — с большим интересом почитаю.
                            Молодцы ребята!
                              0
                              Получается, что при моделировании, при некоторых установленых оптимальных эндогенных оценках состояния и запаса энергии различных нейронов, можно добиться нужной реакции системы на поданую информацию? Или эти значения берутся статические? Может ли процесс обучения сети заключаться не в изменении веса связей нейронов, а в изменении оптимальных значений состояния нейронов?
                              Прошу прощения, если написала бред :)
                              Даже если я недопоняла, статья интересна, спасибо.

                                +2
                                Вы написали не бред, так что можете быть спокойны.=)

                                Задача подбора оптимальных параметров модели при решении конкретной задачи — это возможный путь развития. С моей точки зрения наименее интересный.
                                Самое интересное — это посмотреть как эти оптимальные эндогенные оценки будут меняться гомеостазом высшего уровня и в процессе эволюционной адаптации.

                                В одной из моих следующих статей я выражу свое мнение относительно обучения нейронной сети изменением весов, однако здесь выскажусь кратко.
                                Безусловно большинство процессов адаптации в течение жизни у индивида происходит за счет изменения синаптической проводимости. Однако, уже сейчас становится понятно, что этот процесс не случайный и подчиняется не только банальному правилу Хебба (STDP-правилу в общем случае). Он управляется некоторым системным уровнем. Как он работает — есть только гипотезы. Как эта работа обеспечивается на нейрональном уровне (то есть именно за счет изменения проводимости и изменения в самих нейронах) — это еще более сложный вопрос. Именно поэтому сейчас мы можем только модельно конструировать системный уровень более сложными операциями нежели изменение веса (какие это могут быть операции я думаю, что опять же напишу в одной из следующих статей). При этом в таких моделях изменение весов в процессе самообучения остается, однако является скорее вспомогательным элементом.
                                  0
                                  Спасибо. Будет интересно прочесть продолжение. Рада видеть, что кто-то занимается нейросетями с энтузиазмом и неподдельным научным интересом. У меня так в свое время не получилось, к сожалению.
                                0
                                Очень интересно!
                                Мне кажется у этой модели есть большие перспективы на самом деле.
                                Когда я знакомился с нейронной сетью в качестве платформы для ИИ, у меня возникал вопрос, как она будет мотивироваться. По моему это на самом деле довольно сложный вопрос. Во первых, механизм мотивации должен быть достаточно универсальным для разных факторов, во вторых, он должен иметь приоритеты, в третьих, механизм должен быть очень просто устроен, и должен работать на самом низком уровне. И все это можно сказать о модели описанной в статье.
                                Правильно ли я понял, что ее можно применить для «естественного» приспособления ИИ к среде и в последствии даже к обучению?

                                Вам известны другие механизмы мотивации, исследуемые сегодня? Я бы с удовольствием почитал об этом.

                                >>Данная модель строилось на основании теории функциональных систем П.К. Анохина и теории гомеостаза.

                                Скажите, это теории, или наблюдаемые биологические процессы?

                                  +2
                                  Сейчас многие начинают использовать механизмы мотивации в нейронных сетях, но в 99% случаев — это слишком искусственно.
                                  Для меня есть единственный механизм мотивации — целеполагание и рассогласование.

                                  При доработке и всестороннем имитационном анализе этой модели ее можно применять как хорошую систему, обладающую адаптацией. В этом Вы правы. Однако вопрос обучения в такой системе необходимо рассматривать отдельным пунктом, ибо это отдельная сложнейшая задача. В топике названа одна из частей возможного обучения — это гомеостаз высшего уровня.

                                  Это теории, построенные нейробиологами/нейрофизиологами на основе наблюдаемых явлений. Сейчас эти теории (как и все остальные) пытаются подтвердить как можно большими экспериментами, а также математическим/имитационным моделированием (чему собственно и посвящен топик).
                                  0
                                  А у меня тут ещё идея возникла: смоделировать подыхание нейронов, не сумевших удержать гомеостаз и рождение новых.

                                  По существу: спасибо за интересную статью, в будущем хотелось бы видеть учебные реализации на общепонятных языках, а не только формулы.
                                    +2
                                    Вы абсолютно правы про смерть нейронов. У нас были попытки смоделировать такую систему, однако зачастую запуски модели сводились к деградации и примитивизации нейронной сети. Безусловно смерть нейронов нужно вводить в эту модель, но это добавляет сложность в исследовании зависимости от различных параметров.

                                    Что Вы подразумеваете под учебными реализациями? Программный код? Я думаю, что каждый сам сможет написать алгоритм по модели, которая состоит из менее чем десятка простейших формул=) Я конечно могу приводить свои реализации, но мне кажется это лишнее.
                                    А если Вы говорите про объяснения на словах, то я пытаюсь приводить примеры, однако у меня своеобразное к этому отношение. Примеры — это некоторая вспомогательная вещь, которая воспринимается разными людьми по-разному. Математика же — это всеобщий объективный однозначный язык.=)
                                      0
                                      примитивизация — не факт, что плохо, если в меру. Чтобы было вмеру — да, нужно исследовать. Это уже, наверно, в сторону генетических алгоритмов (я же не только о смерти, но и о размножении говорю, и каждый действительно эгоэстичный элемент должен стремиться выжить, а система — разростаться (но, опять же, что-то должно мешать разрастись излишне)).

                                      Касательно формул — да всеобщий, да объективный язык, но лично мне, к примеру, приходится «пофтыкать» прежде чем я в уме представлю себе как это работает, код на Java или Scala лично я понял бы быстрее.

                                      Я уже примерно представляю себе как это будет выглядеть и с обучением и со всем, попробую поэкспериментировать на Java, хотя в математике я сейчас, к сожалению, ноль.
                                        +1
                                        Просто примитивизация, которая заключается в минимальном обеспечении необходимых функций — это хорошо (правда не всегда, есть исключения). Но в данном случае наблюдалась примитивизация с последующим вымиранием сети в перспективе.

                                        Также предостерегу Вас от путаницы между процессами происходящими во время жизни «агента-организма» и генетическими алгоритмами. Это две разные вещи, которые могут (и должны) дополнять друг друга, но их нельзя путать.
                                        Про разрастание. Тут все зависит от цели исследования. Перед нами стояла цель создать модель на основе теории — поэтому размножение нейронов в нее изначально не заложено в процессе жизни (не путать опять же с ГА =). Это объясняется тем, что нейрогенез в мозге живого человека (и животных тоже) не так значителен, чтобы он мог один обеспечивать функционирование и обучение.

                                        Свои модели я реализую на С/С++, так как их всесторонний анализ связан с большими вычислительными мощностями, поэтому приходится использовать суперкомпьютерный кластер.

                                        Будет интересно почитать о Ваших экспериментах, особенно о Ваших идеях касательно обучения (будьте осторожны в этом пункте и не свалитесь просто к обычному правилу Хебба).
                                          0
                                          Я думал именно о правиле Хебба на микроуровне. Вы меня несколько пугаете большими вычислительными мощностями т.к. таковых нет а реализация моих идей, вероятно, может вылиться в очень сложную модель, от которой (ввиду моей дилетантской нелюбви к математическим выкладкам) Оккам со своей бритвой в гробу перевернётся не один раз. Если вдруг получится что-то жизнеспособное — разумеется непременно поделюсь.
                                            0
                                            Большие мощности необходимы тогда, когда необходимо статистически значимо проверить модель. То есть на достаточно широком пространстве параметров моделирования, на большом спектре различных сред и т.д. Все это выливается в несметное кол-во запусков + после этого еще надо автоматический анализ всей этой кучи данных запускать. Вот так и получается. Но вы не пугайтесь — вам же не в научном журнале печататься, так что на первых порах такой статистики не нужно=))) Но если модель заработает более менее, то тут без такой проверки не обойтись.

                                            Вот в этом комментарии я выразил свое отношение к правилу Хебба — habrahabr.ru/blogs/artificial_intelligence/101926/?reply_to=3172367#comment_3165555.

                                            Еще совет — постарайтесь усложнять модель планомерно. То есть что-то добавили — прогнали, оценили. Если Вы сразу сделаете очень сложную модель, то если она не заработает (а я даю Вам 100 процентов, что сразу в моделировании не работает ничего =)), то вы не сможете понять где надо чтото поменять.
                                    +1
                                    Спасибо за статью. Очень близкая мне идея. Два слоя узлов связаны с окружающим миром — узлы сенсоров и узлы действий. Остальные представляют состояние сознания и процессы, происходящие в нем. Возбуждение узлов сенсоров вызывает мотивацию совершить действие. Только я не совсем понял, как по вашей модели определяется, какое именно действие будет совершено в самом начале, т. е. сразу после запуска. Это чисто-случайный процесс?
                                      +1
                                      Действие совершается только тогда когда становится активен эффекторный нейрон/нейроны. Соответственно термин «в начале» здесь не совсем употребим.
                                      При этом в начале вся система находится в гомеостатическом равновесии и вывести из него ее можно только подав на сенсорный нейрон сигнал рассогласования.
                                      +1
                                      На TED когда-то было одно выступление. Идея была в том, что мозг — это не просто структура из нейронов.

                                      Поэтому когда пытаются оценивать вычислительную мощность мозга по количеству нейронов, то это не совсем верно. На самом деле нейроны сами по себе имеют структуру, и эта структура может играть роль при «вычислениях» в мозге. То есть вычислительная мощность мозга больше чем предполагается.

                                      Еще оттуда запомнился аргумент, что существуют организмы, у которых поведение имеет определенную логику, хотя у самих организмов нет ни одного нейрона. Например, инфузория туфелька. Точно так же и нейроны могут обладать своей структурой и логикой.

                                      Большое спасибо за статью.
                                        0
                                        Подскажите плз есть ли работы по прогнозированию с помощью нейронных сетей?
                                          0
                                          Уверен, что есть, но я этим не занимаюсь.
                                          Фундаментальная основа решения задачи прогноза осуществляется в теории нейронных сетей с помощью самых обычных архитектур (МНС и РБФ, например) и теми же самыми методами обучения, только обучающая выборка составляется специальным образом. Фактически определяется кол-во входов нейросети (от балды) и если есть некоторая статистика какого-то значения, которое нужно спрогнозировать, в некоторые отчетные периоды (раз в год например), то составляется обучающая выборка следующим образом. В качестве примера обучющей выборки берется некоторое окно от k (любое число) до k+n (n — это кол-во входных нейронов сети) отчетных периодов в имеющейся статистике. Это окно сдвигается по всей статистике и таким образом набирается выборка. А дальше все стандартно. Все что я описал выше Вы можете прочесть практически в любом путном учебнике по нейронным сетям и их применению.

                                          Если Вы хотите заниматься/занимаетесь этим более серьезно и вам нужные новые разработки, то надо искать статьи в конкретной области, так как понятно, что специфика формирования нейронной сети для прогноза сильно зависит от области применения (финансы, история, биржы и т.д.)
                                          0
                                          Идея интересная, но навскидку — сомнительна.

                                          Живые нейроны гомеостатичны по одной единственной причине — живому организму нужна энергия, поэтому вся совокупность нейронов равно как и сам организм стремится к её глобальному минимуму. Именно это природа гомеостатичности, она характерна для почти любой клетки, не только нервной. Поэтому надо полагать сам факт гомеостатичности вторичен (в смысле эффективности вычислений) если вообще важен.

                                          В ИНС этот фактор большой роли не сыграет, т.к. неважно в какой именно точке сигмоидальной траектории будет находиться «среднее состояние» нейрона. Это может повлиять лишь на точность вычислений из-за дискретной природы реализации сигмоиды в двоичной машине, но это легко решается повышением разрядности.

                                          Математически введение подобного усовершенствования просто перераспределит веса таким образом, чтобы рабочая точка каждого нейрона по всему массиву выборки стремилась к нулю (для гип. тангенса), что это дает принципиально нового — непонятно. Будет также серьезный провал в скорости обучения из-за «переливания» весов между нейронами.

                                          Плюс в решении конечно тоже возможен: нейрон работающий и выше и ниже нуля имеет более занятную функцию второй производной на рабочем участке, что в целом повышает нелинейность сети при минимальном количестве нейронов, но так уж ли значим такой плюс?

                                          P.S. Добавил комментарий для себя, как заметку, дабы не забыть просто.

                                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                          Самое читаемое