select_zvezdo4ka_from24 мая в 22:24

Когда нейросети перестанут галлюцинировать? И почему на «что за дичь» они несут ещё большую дичь?

Простой

4 мин

16K

Искусственный интеллектВизуализация данных *

Аналитика

+10

Комментарии 24

Kot_na_klaviature 24 мая в 23:45

Задача: сгенерировать другой текст

Нет у модели никакой "задачи сгенерировать другой текст". Просто контекст с твоими замечаниями меняется и модель на этот обновленный контекст формирует вероятный ответ.

The_TTwiNN 25 мая в 05:13

Плюс, контекст загоняет её в ещё более узкие рамки. А если вопрос был абсурден, то шанс получения чуши в ответ от этого только увеличивается.

ToniDoni 24 мая в 23:56

все-таки больше стоит верить RAG

ну вот закончили за упокой - зачем верить? Это же математкика, нужно понижать вероятность галлюцинации. Например попросите модель не просто отвечать на вопрос но и объяснять, опираясь на весь доступный контекст. Сгенерировать логичное непротиворечивое полностью ложное объяснение для модели менее вероятно, чем просто сказать что она знает, как в анекдоте про Вовочку)

Real_Egor 25 мая в 00:51

а только у меня желание... применить оружие автора против него же? (спросить "что это за дичь? что ты несешь?")

вообще больше похоже на мистификацию колдовства, чем на разбор галлюцинаций.

ИМХО: галлюцинации у ЛЛМ будут всегда. Как и у людей.

achekalin 25 мая в 00:56

Ответ про файлы - думается, тут только на агентную систему, которая условный grep хотя бы рассматривает как лишний вариант что-то сделать.

Dmitri-D 25 мая в 01:49

Системный промпт современных моделй уже включает инструкции - воспринимать критически вопрос пользователя. Задайте любой внутренне противоречивый вопрос и модель с большой вероятностью это распознает и вас поправит. Она не воспринимает вопрос как факт. Раньше это была дырка, ее поравили. Это не означает что галюцинации исчезли. Просто они перестали часто попадаться в этом году. Или я перестал их замечать. Ценность AI только выросла, особенно в режиме диалога - где я могу оценить и сравнить варианты и выбрать тот, который подходит лучше. В сущности - это удобнее, чем рыскать в поиске.
Если вы сталкиваетесь с галюцинациями в современных версиях популярных моделей - расскажите в каких конкретно и что произошло.

BlackMokona 25 мая в 03:42

Модели ещё умнее становяться, что уменьшает шанс галюнов и улучшает их независимое мышление

mckeenly15 25 мая в 05:16

Hallucination rate на AA-Omniscience у GPT-5.5 - 86%. https://habr.com/ru/news/1028706/

debagger 25 мая в 02:06

При повторных запросах модели часто используют более высокую случайность генерации (температуру), чтобы выдать не тот же самый ошибочный ответ.

Очень сомнительное утверждение. Я могу конечно себе представить себе обвязку, которая меняет температуру в процессе диалога, но в общем случае это не так.

НЛО прилетело и опубликовало эту надпись здесь

BlackMokona 25 мая в 03:44

Естественный интеллект так же не вызывает никого доверия нигде, поэтому все сферы где задействован ЕИ имеют контроль, который пропорционален ответственности дела.

Jack444 25 мая в 03:41

Если сеть наизусть запомнит всю мировую литературу + биография каждого писателя/учёного/политика + историю всех компаний + документации по всем ЯП со всеми инструментами/фреймворками/библиотеками - это будет занимать зетобайты оперативной памяти, параметров панадобится милиарды трилиардов, запрос будет выполнятся по несколько минут и жрать много ресурсов. Супер ИИ только для избранных, до народа урезанные отжимки будут доходить.

BlackMokona 25 мая в 03:52

Ему не нужно всё это запоминать. Можно сделать ему внешнюю базу данных, к которой он будет обращаться. Икс.АИ для этого делают Грокопедию например. Думаю и остальные разработчики аналогичную штуку в итоге сделают. Чтобы ИИ независел от случайных ресурсов и анонимов в инете, а имел строгую базу данных. Которую к тому же можно поправить легко, по требованию гос.органов и своим нуждам

MrCina32 25 мая в 04:43

Недавно сказал Кодексу, "давай изменим это, таким-то способом, хочу вот так, хочу сяк": Кодекс ответил: "Друг, оно тебе надо? Сломаем все. Вот смотри как можно сделать." И переубедил меня от пагубной идеи, сделал то что я хотел, только другим путем.

Rive 25 мая в 05:05

Способность LLM сопротивляться суггестивным приказам и вопросам иногда просто замечательная.

Dhwtj 25 мая в 05:44

Особенно в политике.

Западную повестку гнет уверенно, хрен переубедить

Dhwtj 25 мая в 05:42

Потому что у LLM нет опыта, множества источников разной степени доверия, нет критического мышления.

Кожаный, ты уверен в А?

Не очень, я видел А только один раз.

Уверен, я видел А несколько раз, никаких исключений

Не уверен, я видел когда был А, но иногда был Б в такой же ситуации

Почти уверен, один врун сказал что бывает Б, но он всегда врёт

И так далее, с подтверждением иными фактами из жизни

longtolik 25 мая в 05:58

Если взять нормально натренированный трансформер, то он не галлюцинирует. Если он вдруг выдал что-то не то - то он - ненормально натренированный трансформер. Это типа система уравнений, если уж она стала решать, то и будет. Математика, и никакого чуда и чудачества тут нет. Если есть сомнения, могу продемонстрировать. А кроме того, есть сети, например, нейроморфные, они вообще не галлюцинируют, просто так спроектированы. Это я знаю по документации к чипам и результатам работы.

debagger 25 мая в 09:39

Со стандартными настройками сэмплеров ответ всегда будет носить вероятностный характер. Там прямо в архитектуру генератор случайных чисел заложен. Чтобы получить детерминированный ответ - надо либо фиксированный сид, либо очень нестандартные настройки сэмплеров.

longtolik 25 мая в 10:26

Seed у меня не фиксированный (вот для проверки я его расфиксировал). И от этого не зависит. Сначала веса инициализируются случайными числами. Любыми. Хоть псевдослучайными, хоть идеально случайными. Но в процессе тренировки они принимают нужные значения. Конечно, если loss стремится к нулю (или хотя бы около 1 в моем частном случае). После этого трансформер будет чётко генерировать следующие слова. Без вариантов, если только не захочется самим разнообразить его ответы.
Да, кстати, трансформер у меня подопытный небольшой, на языке C. Поэтому всё прозрачно видно, что в нём и как происходит. Тоже самое было с сетями - можно создать систему уравнений, решить. Потом запустить тренировку и проверить коэффициенты. Такие штуки делают и на Rust. Если лень решать системы уравнений, применяют сети (для этого они и хороши, когда трудно или нельзя формализировать задачу).

debagger 26 мая в 00:51

Я не знаю, как у вас сделано, но в обычно в LLM сеть на выходе выдает распределение вероятности следующего токена, а на основании этого распределения сэмплер уже выбирает, какой следующий токен выдать. Можно сэмплер настроить таким образом, чтобы он всегда выдавал токен с максимальной вероятностью, но в общем случае так не делают.

longtolik 26 мая в 08:04

Вы правы, так и есть. Можно вывести весь массив scalled logits и посмотреть, там еще softmax probs, веса и т.д.. Начинал я с букв в словах, там словарь - всего 27 элементов (26 латинских буке и символ EOS). Напротив каждой буквы выводил число, соответствующее вероятности. Сразу видно, что к чему. Если температура 0.1, например, то трансформер четко выдает последовательности, которым его научили. Это - трансформер.
Мы немного о разном говорили.
Повторить последовательность, как попугай он может. Это сделать легче, как музыканту сыграть по нотам. Но импровизировать сложнее. Если Вам дадут текст на иностранном языке с докладом, то проще его выучить наизусть. Иначе, чтобы говорить своими словами, нужно знать, как строятся фразы, предложения и т.д. Или высказывание на латыни, Скажите своими словами "Memento mori".
Я иду от простого к сложному. Если мы говорим:
dog is animal
cat is animal
dog drinks water
he is dog
то потом можно спросить:
he drinks? Модель должна ответить "water".
Потому что, когда мы ее учим у нее в эмбеддингах векторы для animal, dog и cat становятся ближе друг к другу. Проверяю это с помощью косинусного сходства (можно еще попробовать коэффициент корреляции между векторами). К коту в друзья попала собака, медведь, белка и где-то вдали лошадь.
То есть, если спросить: bear drinks? Модель ответит: water тоже. Тут надо четко следить, чтобы этот ответ не был из-за того, что пара: "drinks-water" стала причиной.
Если процесс обучения проходит правильно, то модель будет выдавать нормальные фразы, а не галлюцинации. Чуда тут тоже нет. На деле, при обучении на детских сказках, модель иногда, особенно, если температура больше, выдает "перлы" , но осмысленные и забавные, которых не было в исходных данных. Дети тоже так делают, они считают, что родители женились дважды, если у них двое детей, что если девочку родила мама, то мальчика родит папа и прочее. Галлюцинации это или нет, кто знает.
Меня больше возмущает то, как учат огромные модели сразу огромным объемам данных. При этом попадает много мусора, который уже не вычистить.
Это как взять человека, он просидит на печи тридцать лет и три года, а потом ему сгрузить учебники из института. Или если бы в школе были не отдельные уроки, а пришли бы сразу учителя по всем предметам и начали сразу всему учить.

ENick 25 мая в 15:02

Вспомнил анекдот: Прибегает помощник к политику с криком: "Кошмар! Там в прессе про Вас такие фейки написали!". Политик: "Успокойся! Это не кошмар. Кошмар будет, если они правду напишут"

stepigal 26 мая в 20:06

Автор поста допустил много ошибок, которые и привели к подобному результату. Не буду их тут долго перечилять - читайте aiprompting.ru/ppef

Зарегистрируйтесь на Хабре, чтобы оставить комментарий