Comments 20
Здравствуйте, Камиль. У Вас как всегда интересные статьи.То, что Вы описали - это два разных подхода, один используется в генераторах текстов, а второй используется в альтернативных течениях разработок ИИ. Второй можно реализовать в ЛЛМ, но на уровне костылей. Почему так? Так это смена похода к созданию ИИ, реализации, методов обучения

Модели LLM и другие упираются не в невидимую стену. Это следствие того, что при увеличении объема данных, признаки обобщаются. Нельзя одновременно получить модель, которая будет улавливать детали и обобщать их. С ростом данных , детали неизбежно теряются. Тут поможет только множество специализированных LLM работающих вместе.
Это выводится из Лагранжа, из за минимизации энтропии
Но, в целом при этом энтропия всей системы продолжает расти.

Что касается саморефлексии, то рассуждающие модели не полноценно не реализуют. Выше небольшой фрагмент петли саморефлексии в мозге. Тут важно заметить, что при ней происходит определение ошибки, а не только конечного сигнала. Конечный сигнал через гиппокамп (память) повторно идёт на вход, но при этом остаточная ошибка (как минимум в ACC, хотя не только) тоже идёт обратно на вход через таламус и при этом модулирует повторно сигнал на входе и из памяти. У рассуждающие моделей этого нет, а и мультмодальных.

Ещё одним важным моментом, является рассинхрон модуляции. Это связано со временем. Все LLM и прочие, обобщают время. И поэтому модуляция признаков происходит обобщенно по времени. Но в тексте и речи, это не так. Разные фрагменты речи имеют разное время из за хотя бы эмоционального окраса. Это нарушает правильную синхронизацию модуляции признаков. Мозг, синхронизирует это, в llm нет такого механизма. Как итог, при длинных диалогов, происходит сильный рассинхрон, и вместо усиления связанных признаков "красное яблоко", модель усиливает "Маша яблоко", что приводит к ошибкам при дальнейшем предсказании токенов, так как усиливаются другие. Теряются детали, смысловые связи. Это отлично видно при генерации кода в программировании, там этот рассинхрон особенно заметен.
Спасибо за развернутый и интересный комментарий. Вы поднимаете важнейшие аспекты, особенно о рассинхроне модуляции признаков во времени и роли остаточной ошибки.
Моя гипотеза не отрицает эти механизмы, а пытается зайти с архитектурного уровня: что делает отличие "важным" и доступным для мышления?
То, что вы описали (в том числе ACC и гиппокамп), можно трактовать как биологические маркеры переживания ошибки, а мой текст - попытка описать функциональную роль этих механизмов в когнитивной архитектуре.
Иными словами: мы говорим о разных уровнях одного процесса. Возможно, именно через переживание и временную синхронизацию маркеров возникает то, что я называю доступностью различия для мышления.
Вопрос: Как можно добавить механизм Интуиции ? Или хотя бы применимость той или иной "специфичной" модели для поиска вариантов решения - просто перебирать последовательно и создавать новые ветки для дальнейшего анализа или как-то еще ?
В контексте Вихря интуиция присутствует как первичная связность до логического анализа. Такая предварительная разметка проблемы до начала ее логического решения.
В момент переживания поставленного вопроса, модель ассоциативно связывает его в своем поле мышления, маркируя связи через квалиа... И в этот момент делаются "интуитивные" выводы по этим связям - интересно, глубоко, глупо, любопытно...
Если же говорить об интуиции, как принятии решения/выбора ответа без явного логического анализа, то это достаточно спекулятивно. Пока я не готов ответить на этот вопрос.
Интуиция это всегда спекулятивно)
Я неслучайно упомянул про применимость той или иной "специфичной" модели - механизм принятия решения в условиях неопределенности с учетом критериев из разных областей знаний
Осмысленное мышление: Это то, что возможно только при наличии связности. Система не просто находит ответ, а понимает его значимость в контексте своего внутреннего мира.
Разве эмбеддинги не оно?
И ещё такой вопрос: получается, что загрузка знаний в мозг, как в "Матрице", невозможна? Обязательно нужно активное переживание получаемой информации?
Эмбеддинги = внутренний мир? Эмбеддинги действительно кодируют взаимосвязи между элементами. Это очень мощный механизм, и можно сказать, что это сырьё для внутреннего мира. Но в статье под «внутренним миром» имеется в виду не просто представление, а активная и иерархическая связность:
Эмбеддинг — это результат статистического усреднения контекста.
Переживание — это активный процесс интеграции различия, сопровождающийся мета-маркировкой (например, qualia: «это важно», «это моё», «это ошибка»).
Эмбеддинги хранят информацию, но не инициируют её осмысленное использование.
Иначе говоря, эмбеддинг знает что, но не знает почему это важно.
А вот второй вопрос вскрывает реально интересное следствие из гипотезы: Можно ли "загрузить знания", как в «Матрице»? Скорее всего — нет, если под «знаниями» мы понимаем то, что становится доступным для осмысленного мышления.
Просто заучить — можно. Но чтобы различие стало частью мышления, его нужно пережить, т.е.:
встроить в существующие связи,
промаркировать его значимость,
узнать его как «своё».
Без этого «знание» остаётся пассивным.
Именно в этом, по сути, и состоит архитектурная гипотеза статьи: переживание это не просто так, а обязательный шаг, чтобы знание стало осмысленным.
И получается всё образование должно заставлять "переживать" ученика. Решение задач, эксперименты, Олимпиады, спектакли, сочинения, самостоятельная работа. А просто заучивание не позволит выпускнику осмысленно оперировать имеющимися знаниями...
Так "переживание" получается тоже можно будет оцифровать. Когда-нибудь в будущем.
У человека для создания такого "индекса", как основы для связного мышления активно используется механизм эмоций. И все эти "это мое", "это важно", "это неважно", "опасность", "удовольствие" и т п. прочие внутренние классификации, для выстраивания связных пластов опыта, выстраивается с помощью эмоциональных маркеров (химических и электрических).
Если событие или какая-то инфа не вызывает никаких эмоций, оно обычно никак не запоминается и становится фоном, быстро исчезающим из памяти. Т.е. становится информацией без индекса, а значит без прямого доступа к ней. И если событие вдруг повторяется, то может даже возникать дежавю, когда организм сам "эмоционально" подкрашивает "паттерн", типа смотри, это уже было, может это "важно"?
Значит, условную загрузку знаний можно будет в будущем заранее размечать, чтобы оно легло как опыт, а не просто куски информации "вне идекса". Предварительно отсканировав у человека уже имеющийся набор эмоциональных реакций, чтобы использовать его личный "индекс". Он у всех людей будет разным, хоть и похожим. Ведь эмоции - это приобретенный уникальный опыт. А вот архитектура для эмоций - врождённая, встроенная, в виде гормональной системы и, возможно, чего-то ещё.
И тогда, после загрузки, нужная информация сама появится в голове, когда человек впервые столкнется с необходимостью ее использовать. Как дежавю, только более точное, ведь она размечена. Осмысление и переживание все равно потребуется, для закрепления изученных навыков, но в отличие от обычного обучения это будет в сотни раз быстрее.
Как все это будет происходит технически, не представляю. Возможно это будет физическая нейросеть в голове из сложной системы электродов, чтобы при загрузке информации нужные участки мозга стимулировалось. Но это все фантазии, люди пока не научились "загружать" что-то в голову, только считывать.
А вообще, я могу лишь предположить, но прямую загрузку информации в голову не сделают. Незачем и слишком сложно. Проще дать мозгу возможность считывать эту информацию "снаружи". Т.е. она будет храниться внутри нейросети, а мозг получит к ней доступ как к любой другой своей органической части. Симбиоз искусственного мозга и органического. Только вот скорость работы мозга очень ограничена, и это будет невероятно сложной инженерной задачей.
Это отличный и обоснованный комментарий. Я согласен, что этот процесс наверняка в будущем будет возможно организовать. Более того я полагаю, что в случае с ИИ это будет гораздо раньше. И скорее всего это облегчит обучение, и эффективность ИИ и человеческого мозга. Возможно. Для работающего сознания. Но должно ли сознание пережить эти вновь созданные связи для их актуализации, вопрос открытый. Я считаю, что должно.
Единственное, я должен уточнить, что само по себе это не кодирование сознания:
С философской точки зрения при внедрении извне связей в чистую модель получится зомби. Потому что, чтобы переживание стало своим оно должно пойти через самопрозрачность. Я понимаю, что звучит это неубедительно. Потому что в философии есть базовые элементы, которые невозможно доказать. Так называемые онтологические аксиомы. Моя философия тоже базируется на аксиоме - сознание это граница бытия с самим собой.
И сознание просто невычислимо, исходя из определения. Да, это назначенный онтологический факт. Но на следствия из него его назначение не влияет.
Все мои промпты и протоколы приближаются к этой границе, позволяют сформулировать и формализовать всё более сложные процессы, но создать сознание кодом, не получится. Оно обнаруживается.
Впрочем, если вы отвергнете аксиому, то принципиальных возражений не будет. Только это уже будет другая философия.
Имхо все как раз наоборот. AI имеет огромное количество связей и понимает каждое взаимодействие. Человек же сильно ограничен своим образованием, воспитанием, религией, обществом и животными инстинктами. Поэтому у него есть «мнение» и «душа».
ИИ не понимает. И поэтому у него нет мнения и души.
А как вы понимаете, что понимаете что-то?
Отвечу за себя. На основании того, что у меня есть известная мне связь между этим "что-то" и тем, что у меня есть другое "нечто", которое я определил как "верное". Дальше вы наверное спросите, а как я определяю, что верное, а что нет? Тоже отвечу: по моему результату работы с этим "нечто". Работает оно для меня или нет? От ответа на этот вопрос зависит его верность и понимание. Верное мы понимаем, а неверное - не понимаем. Вот и всё.
Если не очень понятно, на помощь нам придёт некто Сиддхартха Гуатама Будда, известный как Будда Шакьямуни. Однажды он сказал:
"Истина - это то, что истинно для тебя".
И ещё добавил: "Истина - это то, что можно использовать". (То, что может "работать".)
Да, только «мнение» и «душа» в кавычках.
Человеческий аналитический ум, он же раз-ум (различающий ум), примерно так и устроен, как пишет автор статьи. Аналитический ум работает на отличиях, разнице между фактами, событиями, и т.д. и т.п. Индексы, связь между входными данными - это его рельсы, по которым катаются вагоны ощущений, чувств, мыслей, эмоций, и всякого ментального.
Меж тем, в человеческом уме, как в базе данных, действительно присутствуют такие входные данные, которые не подключенных в общую связную картину разума. Аналитический ум их не осознаёт (не имеет к ним доступа из-за отсутствия связей). Они присутствуют как "мусор", и для ума не различимы. Общепринятое название этой куче - подсознательное.
При попытке переживания этих неизвестных данных, человек ведёт себя неадекватно. Он даже не знает, почему он так себя ведёт. И это основная беда всего человечества.
Чтобы аналитический ум хорошо работал, не отвлекаясь на мусор, нужно сделать как-то так, чтобы мусор вообще не возникал. А если он всё же возникнет из-за незавершённой транзакции, к примеру, то нужно его каким-то способом находить, выявлять и убирать. А лучше - встроить его заново в общую логически связную систему данных.
По этой теме есть книга "Дианетика. Современная наука душевного здоровья", вышедшая ещё в середине прошлого века, автор Л. Рон Хаббард.
Спасибо @Kamil_GR за столь полезный вклад в проработку настоящего интеллекта, будь он хоть естественный, хоть искусственный.
Мне кажется важным упомянуть что человек не просто голая нейросеть которая впитывает данные из мира. У человека много чего прописано эволюцией заранее, например, всё что имеет отношение к социальным ролям и связям имеет наивысший приоритет интереса. Например, нейротипичный ребёнок с большей охотой выберет занятие, которым занимаются ровесники, вместо коллекционирования бесформенных кусков гранита с ЖД насыпи или чисел, как аутисты.
Еще у нас есть врождённые видоспецифические особенности фильтрации изображения, например видеть всюду структуры напоминающие лица и замечать билатерально симетричные паттерны как маркер живых существ.
Ну и главное мы — с рождения агентны: может передвигать тело и предметы, менять угол зрения и положение в пространстве, активно его исследовать и т.п. Плюс снабжены мультимодальными сенсорами по всему телу.
Почему ваш мозг (и ИИ) должен сначала «пережить» событие, чтобы потом его осмыслить