linabesson12 мая в 08:37

Снимаем с ИИ марковское одеяло

Простой

3 мин

8.1K

Искусственный интеллектАнализ и проектирование систем *

Аналитика

Комментарии 6

egranty 12 мая в 10:08

Markov blanket — это граница наблюдателя, а не субъекта

Свойство Маркова: будущее состояние зависит только от настоящего; прошлое не даёт дополнительной информации

Возможно, вы слишком упрощенно понимаете “Марковское одеяло”. На всякий случай, оставлю это здесь https://www.youtube.com/watch?v=RrqQ00TWSUE

linabesson 23 мая в 14:57

Почему же, не упрощенно) статистическая граница, отделяющая внутренние состояния от внешних через условную независимость. И я отказываюсь от этой рамки целиком, потому что граница субъекта не статистика. Видео на YouTube не аргумент. Если есть что возразить по разделу 2, пишите по разделу 2.

НЛО прилетело и опубликовало эту надпись здесь

proxy3d 21 мая в 13:25

Free Energy Principle построена на теории вероятности и Марковской цепи, при этом вы оперируете к Марковскому одеяло и одновременно игнорируете марковскую цепь связанную с ним (когда пишите Марковская память — это архитектурная ложь). Сюрпраз о котором вы пишите - это как раз -ln(P) где P это вероятность.

proxy3d 21 мая в 15:12

Для примера Cortical Labs и систему DishBrain, эксперимент, где культура живых нейронов училась играть в Pong.

Для многих новостей это выглядело как: нейроны играют в Pong. Но для самих авторов центральной была проверка идей Free Energy Principle и active inference.

Идея была примерно такой. Есть культура нейронов, сенсорный вход, обратная связь, возможность действия на среду.

Если системе давать предсказуемую сенсорику при правильных действиях и хаотическую/непредсказуемую при “неправильных”, то нейронная система начинает самоорганизовываться так, чтобы минимизировать непредсказуемость входов и стабилизировать сенсорный поток. Это очень близко к active inference framing.

Ключевой момент, что нейроны не знали Pong.Никто не объяснял правила, не обучал через labels, не делал supervised learning, не делал RLHF.

Нейроны вообще не знали, что такое мяч, не знали, что такое игра, не знали, что такое выигрыш. Но система адаптировала динамику, уменьшала неожиданные сенсорные состояния.

Это и было интерпретировано как минимизация surprise / variational free energy.

Это НЕ означает, что FEP доказан окончательно. И не означает, что FEP единственная теория. Но это сильный аргумент, что FEP не является бессмысленной философией и active inference имеет экспериментальную ценность.

И это уже уровень не философской работы, а повторяемых экспериментов.

linabesson 23 мая в 14:59

Спасибо, отвечу по пунктам и не соглашусь ни по одному.

Я отвергаю обе конструкции как основание для архитектуры субъекта. Blanket — потому что он рисуется наблюдателем извне и не работает как живая граница (раздел 2). Chain — потому что марковское свойство сжимает прошлое в текущее состояние и убивает накопленную траекторию (раздел 4). Это две разные претензии и обе остаются в силе.

Что surprise = -ln§ — да, я знаю. И именно к этому претензия. Логарифм вероятности — это работа наблюдателя со статистикой входов. Живое не оперирует вероятностями относительно своих сенсоров. Живое оперирует доминантой — ведущим напряжением, которое подавляет шум независимо от его статистической значимости (у нас Ухтомский). Это разные онтологии, и одна не сводится к другой.

Теперь по DishBrain. Что показано в эксперименте Kagan et al.: культура нейронов в закрытом контуре с обратной связью стабилизирует сенсорный поток под навязанные правила игры. Это интересный факт о нейронной ткани. Это не доказательство FEP.

Что не показано: — что у культуры есть персистентная идентичность между сессиями — что у неё есть собственная мотивация вне навязанного контура — что она способна отторгать вход, а не только встраивать его — что вне стимуляции она остаётся субъектом

Уберите электрод — культура не пойдёт играть в Pong сама. Дайте противоречивый вход — она встроит, а не отвергнет. Это и есть граница, о которой я пишу: FEP описывает условия, в которых ткань реагирует на навязанный контур. Не более.

И заметьте, что сами авторы DishBrain нигде не утверждают, что подняли субъекта. Они утверждают, что показали обучение без supervised сигнала. Это разные тезисы.

Открытый вызов в конце поста остаётся. Покажите культуру или агента с накопленным характером между сессиями, с собственной мотивацией, с операциональной границей “я”. DishBrain этого не делает. FEP за десять лет этого не сделал. Это и есть диагноз.

Я свою рамку отрабатываю практически, общаться лучше по существу, а не по терминологии.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий