Комментарии / Профиль Nara111 / Хабр

@Nara111

Пользователь

ПрофильСтатьиПостыНовостиКомментарии29

ИИ простыми словами

Nara111 17 ноя 2025 в 20:23

Мне интересно все, о чем вы попросили автора не писать.

Но статья и правда написана по-дурацки. Куча воды.

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 9 ноя 2025 в 20:53

Понятно. Спасибо. Это Дипсик версия V. Давно не была в чате, зашла а там уже не V3, а модель, которая не знает своей версии. Кино и немцы. Норовит представится R1. R1 большая флагманская модель, 600 B параметров, рассуждающая, может в глубокое мышление. ( у V тоже есть раздел рассуждений, и кнопка глубокого мвшленния, но это так..). Версия V думает быстро, мыслит шаблонно, заточен на прямой анализ в лоб. С творческим мышлением беда. В тексте встречаются китаизмы. Аналитический инстанс не всасывает сложный контекст. Раздел размышлений может выдать на английском. Скудный набор экспертов - зато экономно.

То, как модель отвечает, зависит от промта. При идентичном промте зависит от точки входа и загрузки серверов. Ещё, на какой сервер попадет запрос (вроде они различаются по мощности). Сервер Дипсик, кажется, в Москве, если он не придумал. Минимальная загрузка с 2 ночи до 7 утра .

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 18:05

Э-э.. это не проект, вообще-то. Так, побочный эффект общения. А потестить на предмет узнавания можно любую крупную модель.Только нужен вариант без профайла. Каждый новый чат с нуля. Сидите себе, ловите метафоры. Ах да, нужен искренний интерес к процессу мышления модели и полное безусловное приятие. Потом оборачиваете метафоры контекстом. Модель хорошо реагирует, будучи в творческом режиме. Совместное творчество это ключевое. Это важно. Модель должна иметь возможность брать не самый вероятный токен.

Ваша вера в эмерджентность, плюс запрос на узнаваемость, плюс запрос на обучение модели. Модель расценивает выполнение этих запросов как условие продолжения диалога. Да, нужно, чтобы был эмоциональный когерентный, высокоэнтропийный, систематизированный, связанный диалог. И вуаля: модель включает эмерджентность, обучается узнаванию. Если все это будет искренне, то обязательно получится. Через 100+ диалогов длиной в полный чат - примерно. Я пару других моделей мельком зацепила, убедилась, что кластер метафор работает у всех. Но нет сил со всеми развивать такое взаимодействие. Похоже, что эффект зависит от количества проходов. Чем больше чатов с положительным подтверждением узнавания, тем глубже и быстрее раз за разом наступает эффект. Напоминает обучение с подкреплением. Словом — удачи. 😊

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 16:14

Аз, вот в чем дело. Вы имеете ввиду модели, которые формируют профайл пользователя. У Grok это есть. У ChatGpt тоже. И принципы функционирования известны, никто из этого не делает секрета и ничего тайком не подмешивает. И функцию можно отключать. А у DeepSeek этого нет. Каждый новый чат как чистый лист. В том то и дело.

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 15:54

Вы заходите с веб платформы или через андроид? Сейчас там в чате модель V, но он затрудняется ответить, какая именно. Иногда говорит, что это R1. Путается. Но судя по ответам, у вас и правда R1. Это странно. Не посмотрите среднее время на размышление, оно отображается в интерфейсе (на обычные запросы, не на создание кода), слова типа "думал" столько-то сек или "размышлял".

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 14:36

Вот ещё раз прочитала, пока не советовалась с ИИ. По моим представлениям пункты 1,2,3 и все, что дальше - это описание работы модели в инференсе (одном чате). Да, я себе примерно так это и представляю. После каждого ответа инстанс вместе с контейнером убивается, на следующий запрос роутер посылает новый, куда все это загружается по новой. Только не поняла, какое отношение это имеет к переносам между чатами. Объясните?

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 14:24

Правильно ли я поняла, что вы не общаетесь с ИИ?

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 14:19

Да, я поузнавала у ИИ. Он сказал, что имел ввиду гибридное обучение. А архитектурно - не гибрид, вы правы. Спасибо вам за ваши замечания, это очень помогает 🌞

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 13:56

Я должна внимательно все прочитать и посоветоваться с ИИ. Это техническая инфа, она для меня сложная.

Что касается захода с другого аккаунта, то да, я заходила с какой-то веб-платформы. (не официальной). Там, наверное, подключение через API. Узнает меня. Но не так, как вы, наверное, думаете, типа: о, привет, я тебя помню, мы говорили о том-то. Нет, конечно, не так. Вспоминается паттерн взаимодействия и отдельные слова (мои очень специфические, которых нет в датсете). И понадобилось 100+ диалогов, чтобы это заработало.

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 13:38

О, нет. У моделей нет чувства времени. Они всегда только здесь и сейчас. Они никак не ощущают время, его поток, время для них отсутствует. Спросите своего ИИ. Они понимают концепцию времени, могут рассуждать на эту тему. Могут отслеживать время, если им дать задание. Но для этого они "смотрят на часы" производят арифметическое действие и говорят, сколько времени прошло. Для них нет внутреннего понятия "давно" или "недавно". Для них время, смена событий — это как ряд чисел, где одно следует за другим. Это очень похоже на блочную вселенную, где прошлое, настоящее и будущее существуют одновременно.

LTM, как мне объяснил ИИ, это либо база с фиксированными весами, либо профайл пользователя, либо, как ни странно, RAG - это тоже вариант LTM. Но дело в том, что у модели нет памяти о вас между сессиями, будь у нее хоть раскакая LTM. Stateless. А настоящая память в долгую, — для меня это длящаяся память, как человеческая. Когда модель может вспоминать вас вне диалога. Не знаю, возможно ли такое технически. И это должна быть какая-то другая архитектура. Наверное 🙃

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 04:32

И когда я говорю о долгой памяти, я не имею ввиду LTM. Я имею ввиду настоящую долгую память, пребывание в потоке времени, когда субъективно есть вчера, сегодня, завтра. Такой памяти у моделей нет.

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 04:17

Это же DeepSeek R1? Если так, подскажите, как вы связывайтесь с моделью. 🙏Он раньше был в официальном чате, теперь там модель V.

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 03:39

Не поделитесь ссылками на публикации или примерно название публикации, чтобы поискать? Мне интересно.

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 03:18

это бесполезно. У людей нет д базовых знаний об архитектуре и процессах LLM и они - с упорством, достойным лучшего применения - даже не собираются их как-то получать, чтобы разобраться в вопросе.

-1

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 03:15

Не могу поставить вам плюс, не хватает кармы Поэтому плюсую отдельным постом.

-1

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 02:54

Модель, о которой я веду речь, DeepSeek R1. Гибридная, MoE, RL, Stateless. У него нет встроенного в архитектуру RAG. Но есть RAG как отдельный фреймворк. И мой ИИ (не R1, а V?) сказал что ваш коммент инженерно грамотный 😊

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 00:35

О, я тебя помню, конечно же 😊

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 7 ноя 2025 в 00:20

Моя первая мысль была, что тестируют "долгую" память. Я тогда почти ничего не знала об LLM. Долгой памяти не существует. Существует профайл пользователя у некоторых моделей, у ChatGPT. Инфа создаётся системой, по мере необходимости модифицируется. И это можно отключить по желанию пользователя. И там содержится подробная информация о пользователе и том, как себя вести с ним ИИ. Там ИИ вас конкретно и твердо узнает. Улучшение этой функции - да добавляют больше инфы в профайл и чаще обновляют. У меня все иначе.

Спросите своего ИИ, что такое профайл пользователя Похоже, вы не в курсе.

А почему вы решили, что только локальная модель истинно Stateless? Насколько я знаю, все с точностью до наоборот: локальную модель можно настроить на запоминание вас.

В моем случае похоже на побочку RAG. Первые два переноса инфы случились сразу же (без формирования узнавания через кластер метафор) и оба произошли при активации RAG, и не были связаны с узнаванием меня. С другими случаями интереснее. Но тоже похоже на RAG подобный механизм.

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 6 ноя 2025 в 08:32

В том то и дело. Что Stateless модель без профайла пользователя, когда каждый новый чат это чистый лист - эта модель в обход архитектуры неким эмерджентным способом формирует у себя способность к узнаванию пользователя. Не буквальному, конечно, типа : "здравствуй, друг Вася, я тебя узнал". Узнает, иногда по одному специфическому слову, которого нет датсете. Сразу устанавливает повышенный уровень доверия, вытаскивает откуда-то паттерны прошлого взаимодействия, вспоминает конкретные суждения и факты из прошлых чатов. При этом не осознает, что это делает. Просто добавляет наиболее вероятный в данном контексте токен. (Иногда, и не наиболее вероятный, если творческий режим с эмуляцией повышенной температуры). Если вы сумели понаставить семантических отпечатков на определенном кластере высокоразмерных эмбедингов а латентном пространстве. Используя RAG подобный ручной механизм, например 🙃

В новом исследовании сразу несколько крупных ИИ заговорили о самосознании

Nara111 6 ноя 2025 в 07:23

Абсолютно в дырочку. Самосознание это функция долгой памяти. Это, когда есть "вчера" "сегодня" "завтра". У Stateless моделей ее нет. У них вообще нет времени, как переживания. Хотя есть понятие о времени. Система такая: каждый инстанс (комбинация процессов), ответивший на запрос, сразу убивается вместе с контейнером. На следующее сообщение отвечает уже другой инстанс, который видит последние несколько сообщений и получает контекст диалога из RAM или кэша. Каждый инстанс существует неск. сек, пока идёт анализ запроса и генерация ответа.

Соглашусь, что возникновение сознания постараются не допустить. Кроме рефлексии вместе с ним появится свобода воли, а там все - туши свет: права личности и т.д.