SergiiKol Sep 9 at 17:21

Галлюцинации языковых моделей: от математики обмана к честным ИИ

Easy

14 min

5.5K

Business Models * Artificial IntelligenceIT careerMachine learning * System Analysis and Design *

Analytics

Comments 23

EmoCube Sep 9 at 17:43

Статья отличная, и перевод её тоже...

Только не понятно, зачем её пересказывать несколько раз в одной статье?

SergiiKol Sep 9 at 17:49

Спасибо за отзыв, EmoCube!

Повторений действительно много. Это осознанное решение, но понимаю, что может раздражать.

Почему так получилось

Исследование OpenAI — это страницы со сложной математикой. Когда я его читал, сам несколько раз терялся в формулах и доказательствах. Поэтому решил использовать классический принцип технических писателей:

"Скажи что скажешь → скажи → скажи что сказал"

Структура для разных читателей

Введение — для тех, кто хочет понять суть за 2 минуты
Математика — для тех, кто хочет разобраться в механизме
Практика — для тех, кто хочет применить прямо сейчас

Ключевые тезисы (формула 2:1, singleton rate) намеренно повторяются в разных контекстах — так они лучше запоминаются. Как в хорошей презентации.

Но вы правы

Для тех, кто читает всю статью целиком, это выглядит избыточно. Классическая дилемма технического писателя: структура для "сканеров" vs комфорт для "читателей".

В следующих материалах попробую найти баланс — возможно, сделать блоки более независимыми или добавить навигацию "читал уже — переходи сразу к практике".

А какой раздел показался наиболее полезным? Интересно понять, на чем стоит фокусироваться в будущих статьях.

Hardcoin Sep 13 at 10:59

Как в хорошей презентации.

В русском информационном поле это считается плохой презентацией, а не хорошей.

Имеет смысл выбрать, вы пишете статью для рыбок гуппи или людей со знаниями и интеллектом выше среднего (предположительно, на Хабре таких много). Оба варианта найдут свою аудиторию, но это будет разная аудитория. При попытке найти баланс между ними вы промахнетесь по обеим.

Sap_ru Sep 9 at 17:46

Мне одному кажется, что сам принцип обучения и работы нейросетей неизбежно включает себя галлюцинации? Ведь в конечном итоге это поиск оптимума функции, который: во-первых, никогда не может найден; во-вторых, включает в себя массу промежуточных значений, которые не задавались и не проверялись и обучении модели.
То есть даже теоретически можно сделать модель, которая никогда не будет галлюцинировать при ответе на заранее известный вопрос. Но при этом невозможно гарантировать отсутствие галлюцинаций в случае, если мы изменили хотя бы одно слово в вопросе, даже с полным сохранение смысла. Просто потому, что в обучающих точках значение функции задано, а в промежуточных оно может быть произвольным и мы лишь надеемся, что оно будет близко к заданным точкам. При этом можно смело утверждать, что при очень большой количестве параметров функции, в каких-то местах её значение либо не будет близко, либо математическое понятие близости значений будет кардинально отличаться от требуемого нам "интуитивного". И так мест будет много. И именно в них и будут рождаться галлюцинанции.
Ведь так?

SergiiKol Sep 9 at 17:56

Sap_ru,я думаю вы правы — это фундаментальная проблема.

Аппроксимация vs реальность

Ваша формулировка про "промежуточные значения функции" точно описывает суть проблемы. Модель обучается на дискретных точках данных, а между ними пытается интерполировать. И в этих промежутках может выдать что угодно.

В исследовании это называется IIV-редукцией — связь между тем, насколько хорошо модель может отличить правду от лжи, и тем, как часто она врет при генерации. Формула показывает, что ошибки генерации минимум в 2 раза больше ошибок классификации.

Singleton rate как мера проблемы

То, что вы описываете, исследование измеряет через singleton rate — долю фактов, встреченных только один раз. Чем больше таких "одиночек", тем больше промежутков, где функция не определена надежно.

Практический вывод

OpenAI показали: полностью убрать галлюцинации нельзя, но можно изменить поведение модели в промежуточных областях. Вместо попытки угадать — честно сказать "не знаю".

Это не решает математическую проблему аппроксимации, но делает ее предсказуемой и безопасной. Модель перестает врать и начинает признавать границы своих знаний.

По сути, речь идет не об улучшении функции, а об изменении стратегии ее применения

Sap_ru Sep 9 at 18:00

Этот комментарий писала нейросеть. Причём этот аккаунт сейчас носится по всем темам Хабра и пишет случайные нейросетевые комментарии.

SergiiKol Sep 9 at 18:02

ну это не так, никто никуда не носится...

Sap_ru Sep 9 at 20:14

Но комментарий писала нейросеть

randomsimplenumber Sep 10 at 04:44

Непонятно зачем. Если мне будет необходимо получить от нейросети реферат - я и сам могу спросить.

Flokis_guy Sep 10 at 15:19

Увы, мир не идеален.

potan Sep 11 at 17:03

Ну да, общая проблема обучения, не только нейросетй, и не только машинного. У людей ложная память бывает достаточно часто.

Kamil_GR Sep 9 at 18:14

Честно говоря, те кто глубоко работал с ИИ знали это и раньше, майская статья о галлюцинациях:

https://habr.com/ru/companies/timeweb/articles/910056/

Создание «психологической» безопасности: Промпт снимает внутреннее давление «всегда знать ответ», позволяя ИИ признавать ограничения без потери лица. Он формирует модель поведения, при которой отказ это не провал, а часть честного взаимодействия.

ruomserg Sep 9 at 19:27

О! Мы такое тоже увидели. Иногда наши ИИ-агенты впадали в истерику от проблем - и творили дичь. Помогло встраивание в промпт "клапана для стравливания пара" - указания при возникновении нерешаемой проблемы - структурированно исследовать и описать ее и на этом закончить. Иначе получается как в рассказах Г.Гаррисона: "Робот!" - приказал он - "принеси багаж - три предмета!". "Но Васко!" - возразил я - "разве у нас было не два чемодана ?". Робот вернулся обратно, таща с собой наши чемоданы и - выдранное из такси заднее сидение... Ну что же - теперь предметов у нас действительно три!..

NeriaLab Sep 9 at 19:35

Как хорошо, что в LBS/CESP системах, нет и не может быть никаких галлюцинаций. Они не возможны ни на каком уровне

Vikki_Odessa Sep 9 at 23:10

Господа хорошие чему удивляться. ИИ чаты учат самые большие лжецы- люди. Откуда же у моделей взяться честности

Krios0 Sep 10 at 05:04

То, что вы называете галлюцинацией, является субъективным мнением, или субъективным шагом, возникшим в ходе диалога с ИИ. С этой точки зрения любое сознание галлюцинирует, вопрос только в том готовы ли вы признать что ИИ обладает сознанием.

randomsimplenumber Sep 10 at 05:13

То, что вы называете галлюцинацией, является субъективным мнением

6 лапый кот - мое субьективное мнение, я художник, я так вижу

Krios0 Sep 10 at 08:15

Хорошо, что вы это сознаёте, значит вы способны к обучению

randomsimplenumber Sep 10 at 13:02

Это галлюцинация ;)

Krios0 Sep 10 at 16:18

Ахахахаха точно!!)

ALapinskas Sep 10 at 07:03

Ошибка - это не ошибка, а "галлюцинация".

Что угодно придумают лишь бы не распугать инвесторов.

potan Sep 11 at 17:13

Основная причина галлюцинаций - обобщение. Обучаемая система не может и не должна запоминать все предъявленные факты, она должна найти общее правило. Но факты, типа "Вася родился в феврале" обобщить невозможно.
Надо обучающую выборку разделить на две части - содержащую примеры общих правил, и содержащую выделенные факты. И обучать им по разному. Факты вообще хорошо бы помещать в нормальное хранилище, благо нейросеточки хорошо умеют создавать SparQL-запросы.

NeriaLab Sep 11 at 17:19

Легко обобщить фразу "Вася родился в феврале", при помощи: онтологии; семантики; формальной логики; лингвистики