Real_Egor1 мая в 13:56

Классификация галлюцинаций LLM | «Врага нужно знать в лицо»

Средний

22 мин

12K

Natural Language Processing * Машинное обучение *

Туториал

Recovery Mode

+13

Комментарии 13

Wesha 1 мая в 18:27

«Красота в глазах смотрящего»

LLM «выдумывают» всё время: просто иногда то, что они «выдумали», совпадает с наблюдаемой нами реальностью — и мы радуемся, какое оно умное; а иногда — не совпадает, и тогда мы говорим — «а, это была галлюцинация».

Real_Egor 1 мая в 19:26

Мысль очень похожа на развернутый вариант моих предпосылок из пункта 3.3... Я даже словил ДежаВю, читая комментарий... =)

Все мастерство работы с LLM, как мне кажется, заключается именно в умении укротить эти галлюцинации. Не избавиться от них, а сделать их такими, которые нас устроят. Так навык становится управляемым и вырабатываемым. Так мы перестаем раздражаться, что ответ "не соответсвует реальности". Просто нужно делать поправку на то, что модель реальности никогда и не видела, и не щупала. Ну и на то, что люди сами между собой иногда договориться на этот счет не могут, а как договорятся, так потом, через 100 лет, приходит новый человечишка, и переворачивает наше понимание реальности с ног на голову...

Cyber17281 1 мая в 19:16

Прикольно. Жду классификацию ошибок промптинга! Желательно циклом разбить, информации много я так полагаю :)

qqqqq2 2 мая в 05:09

Одинаковый промпт даёт разный результат у разных моделей (а их мильоны), так как обучены они по-разному (сюда же отнесём и всякого рода уменьшения размеров). Да ещё и модели постоянно обновляются. В общем, может оказаться, что классификация устареет к моменту публикации.

Real_Egor 2 мая в 07:07

Одинаковый промпт даёт разный результат у разных моделей (а их мильоны), так как обучены они по-разному (сюда же отнесём и всякого рода уменьшения размеров)

Одинаковый промпт дает разный результат даже у одной и той же модеди. Ровно про это статья и написана...

А в классификацию я уже сейчас могу добавить около 5-7 категорий еще, особенно сильно развивается пятая группа, так как количество механизмов в окружении LLM растет экспоненциально. Я наткнулся на новые виды галлюцинаций уже прям перед публикацией, когда проводил сравнение с англоязычным интернетом. Просто решил не уходить на второй круг

qqqqq2 3 мая в 06:13

Спасибо за публикацию, подписался, обязательно буду читать продолжение.

Dan8601 2 мая в 06:56

Спасибо за статью!

Это буквально статья о том, что в реальности модель умеет примерно НИЧЕГО! Но все делают вид, что это человечество какое-то кривое, а не модель - полная ерунда.

Ну вот прикиньте, у вас есть целая профессия, к примеру, математик. Не все люди в мире математике, да им и не надо. Но часть людей - математики. Они учат какие-то теоремы, решают конкретные задачи. Учатся этому какое-то время

А теперь про LLM. Маркетологи говорят: вот вам LLM, можете общаться с ней как с живым человеком обо всем, что вам нравится. А в итоге, чтобы добиться хоть какого-то полезного результата, нужно читать полотна подобного текста. Следовательно, правильное использование модели - это тоже профессия. И это профессия, в которой вам может понадобиться модель, которая предсказывает следующее слово (привет всем от цепей Маркова и n-грамм, кстати)

Вот прикиньте, если бы вам дали нейронку, которая должна находить крокодилов на картинке, вы загружаете в нее тысячу фотографий, а она на каждой вас что-то спрашивает или каждый раз меняет свои представления о крокодилах, как ей нравится

Real_Egor 2 мая в 06:59

Так правильное использование LLM - это и есть один из обязательных навыков будущего. Уметь добиваться от нее желаемых целей, уметь диагностировать ее сбои, уметь настраивать ее точность, понимать ее механику и принципы работы. Все это навыки, которые нужны будут в будущем так же, как сейчас нужно вождение или навыки работы с компьютером.

Умение настраивать ПК (установка виндоус, драйверов, работа в микрософт офис и т.п.) - это навыки обращения с технологиями.

Умение добиваться желаемого от LLM - это навыки укрощения хаоса вероятностей. Да, «трансформеры» всего лишь предсказывают следующий токен. Но это не значит, что на этот процесс нельзя повлиять.

Dan8601 2 мая в 10:47

"Умение добиваться желаемого от LLM" - это время впустую)

Я помню ещё году так в 2002 умение пользоваться офисом считалось недостижимым. Выпускались огромные книги. Также как и по использованию Виндоус. НО! С тех пор использование винды и офиса стало намного легче, потому что учтены ошибки прошлого. Да и потому что пользователям реально нужно 10% потенциала офиса. Остальное гуглится за минуту. Это я к чему. Программы должны упрощать жизнь людей, а не создавать новые) да и к тому же, чтобы программа прижилась, должно смениться поколение. Я освоил базовое использование компьютера в 4 года. Кто-то не может и в 54 года это сделать

Real_Egor 2 мая в 11:23

я бы сказал, что программы должны не упрощать жизнь людей, а открывать новые горизонты и новые возможности. И LLM это делают лучше, чем почти все изобретения прошлого.

Упрощает ли это жизнь? С учетом того, сколько LLM сжирают электричества... я бы так не сказал. Жизнь и технологии усложняются в геометрической прогрессии.

Dan8601 2 мая в 14:18

Ну, если речь про то, что нужно открывать новые возможности - это в точку. Пока открыты новые возможности для инфоцыганства) и чтобы старшее звено в разработке, которое давно не пишет код, могло тряхнуть стариной и почувствовать свою значимость

Wesha 3 мая в 02:01

Нейронку невозможно «настроить правильно». «Как сейчас получилось — „правильно“ или „неправильно“» — решает оператор. То есть внешний (по отношению к сети) актор.

Splinter91 2 мая в 14:07

Хороший рабор, особенно пункт 4.1 тут описание 100 из 100, у меня были мысли что он (ллм) потом по етим описаниям тянет глюки) Есть ещё такие слова "без магии", "будем честны", и ещё много слов "паразитов".

Зарегистрируйтесь на Хабре, чтобы оставить комментарий