Что происходит внутри LLM, когда ты отправляешь сообщение / Комментарии / Хабр

Попробуй этого телеграм-бота — внутри ChatGPT, Gemini, Grok и DeepSeek, бесплатно. Дай одинаковый запрос разным моделям и посмотри, как по-разному они выстраивают ответ. Например, спроси что-нибудь неоднозначное — «докажи, что 0.999... = 1» или «объясни парадокс Ферми». Разница в подходах хорошо показывает, что у каждой модели свой «характер» — сформированный архитектурой, данными и настройкой.

Какая там может быть разница, если у вас внутри одна и та же глупенькая Llama, которая часто не может дописать ответ? В вашем боте этого ассортимента проприетарных моделей попросту нет.

Вы уже третью сгенерированную статью с рекламой этого бота опубликовали. Зачем вы вводите людей в заблуждение? Кто-то ведь действительно может подумать, что современные флагманские большие языковые модели вот так отвечают.

Зачем вы на Хабре публикуете писанину больших языковых моделей? Тут ведь абсолютно явно писала языковая модель, мне даже никакой детектор не нужен.

Весь текст кишит «это не X, это Y» и прочими характерно разбитыми на два предложения противопоставлениями:

Токен — это не слово и не буква. Это статистически удобная единица текста.

Это не ошибка реализации, это цена за способность к обобщению.

LLM — не поисковик, не база данных и не цифровой человек. Это статистическая машина

Модель не выдаёт следующее слово. Она выдаёт распределение вероятностей

Важно: эмбеддинги не прописываются вручную. Они получаются автоматически в процессе обучения

Понимать устройство этой машины полезно не чтобы разрушить магию. А чтобы знать, где она работает идеально, где её легко сломать

Ненужные кавычки, которые языковые модели так любят расставлять при малейшем оттенке переносного смысла:

контекстное окно «съедается» быстрее

Модель сама «выясняет», что кошки и собаки похожи

Таких «голов» внимания в современных моделях несколько десятков.

Temperature управляет «резкостью» распределения.

Отсюда и «творческий режим», и галлюцинации.

При top-p = 0.9 модель рассматривает только «ядро» наиболее вероятных токенов

Модель не может «передумать»

у каждой модели свой «характер»

К верхнему слою каждый токен уже «знает» о себе всё, что можно было извлечь из контекста.

Никакой «памяти» в человеческом смысле нет.

Всё её «знание» о кошках — это статистика соседства токенов.

Если начинать вчитываться, то в плане смысла всё максимально упрощено и опять же вводит в заблуждение. К примеру:

Алгоритм BPE (Byte Pair Encoding) смотрит на огромный корпус текста и объединяет самые частые пары символов в один токен. Получается словарь из 50–100 тысяч токенов.

А токенизатор o200k_base? В нём возможно 200 019 токенов. Это токенизатор GPT-4o, o1, o3, o4-mini и многих других моделей, включая, насколько помню, «пятёрку» или вообще всё семейство пятых моделей ChatGPT. То есть в текущем его виде токенизатор куда крупнее.

Top-p ограничивает выбор только токенами, суммарная вероятность которых не превышает p.

А тут вообще может быть ошибка. Насколько я понимаю, собирается минимальный набор из наиболее вероятных токенов, чья суммарная вероятность достигает или превышает порог p.

Галлюцинации — обратная сторона интеллекта

Слишком самоуверенное утверждение. Причины для галлюцинаций называют разные, включая особенности обучения и оценочные стимулы, которые поощряли угадывание вместо признания неопределённости ответа. То есть хотя бы частично галлюцинации вполне можно устранить, это не какой-то неизводимый дефект.

Числа, которых в крупных моделях более триллиона

Размер флагманских моделей может измеряться сотнями миллиардов параметров, и что-то конкретное про проприетарные БЯМ сказать невозможно, поскольку это всё предмет коммерческой тайны.

«Память» ChatGPT — это просто очень длинный текстовый файл, который растёт с каждым сообщением и в какой-то момент упирается в лимит контекстного окна.

В веб-морде уже давно есть память, то есть подсовываемые в контекст сведения о пользователе; также иногда ИИ имеет доступ к другим чатам и может по ним что-нибудь поискать.

Вообще, все эти поверхностные обсуждения базовых основ несколько невовремя, поскольку сейчас уже давно идёт общение с агентами, которые к тому же самостоятельно сжимают свой контекст.

Большинство людей представляют языковую модель как умную базу данных: спросил — она нашла ответ и выдала. Это не так.

Нет, именно это обычно и происходит. Лично я привык пользоваться ChatGPT как интернет-поисковиком. К примеру:

Знания самой модели меня при этом не интересуют. Думаю, я не один такой.

Даже обычный чат на ChatGPT.com связан с вызовом инструментов поиска по Интернету, написания кода или генерирования изображений. Здесь же перечисляется поверхностная и устаревшая информация про базовое общение с БЯМ, чем уже года два никто не занимается.

Комментарии 11

gottivartanian 6 июн в 12:15

Хорошо подмечено про «не может передумать посередине». Отсюда житейский лайфхак: не спорить с кривым ответом, а перегенерить с нуля, чуть переформулировав вопрос. Почти всегда лучше, чем десять уточнений вдогонку.

grvelvet 6 июн в 12:52

LLM — не поисковик, не база данных и не цифровой человек. Это статистическая машина, обученная предсказывать текст на таком масштабе, что предсказание стало неотличимо от понимания — по крайней мере внешне.

И уж тем более не искуственный интеллект.

iiibax 6 июн в 19:27

LLM выполняет интеллектуальные задачи?

grvelvet 7 июн в 12:44

Вообще да. Но это не интеллект.

iiibax 7 июн в 12:51

т.е. жонглирующий робот != искуственный жонглёр?

grvelvet 7 июн в 16:03

Имитация. Это гигантская многомерная математическая функция и вероятностная модель языка, она отлично имитирует интеллект.

iiibax 7 июн в 17:45

имитирует интеллект на основе внешних сигналов, почти как человек

это интеллект без человеческого носителя

starfair 8 июн в 08:21

На самом деле, думаю даже самые выдающие нейробиологи современности не дадут ответ на вопрос, а что на самом деле есть мышление у человека. Поэтому, может и не стоит так уж дистанцироваться от схожести статичтического предсказания у LLM и работой наших нейронных сетей в мозгах, которые несомненно более сложные, но не факт, что прямо принципиально иначе работающие.

iReedar 4 часа назад

перцептон то придумали как имитацию мозгов ) так что я бы не исключал что мы и живем в своей голове в сильно сложной, но языковой модели

morginalium8 7 июн в 08:03

раунд... есть отдельный вид наслаждения - читать добротный обзор на нейрослоп. вот когда у комментатора настолько подгорело, что он не просто дизлайк поставил, а сам мини-статью написал.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий