Комментарии 13
«Красота в глазах смотрящего»
LLM «выдумывают» всё время: просто иногда то, что они «выдумали», совпадает с наблюдаемой нами реальностью — и мы радуемся, какое оно умное; а иногда — не совпадает, и тогда мы говорим — «а, это была галлюцинация».
Мысль очень похожа на развернутый вариант моих предпосылок из пункта 3.3... Я даже словил ДежаВю, читая комментарий... =)
Все мастерство работы с LLM, как мне кажется, заключается именно в умении укротить эти галлюцинации. Не избавиться от них, а сделать их такими, которые нас устроят. Так навык становится управляемым и вырабатываемым. Так мы перестаем раздражаться, что ответ "не соответсвует реальности". Просто нужно делать поправку на то, что модель реальности никогда и не видела, и не щупала. Ну и на то, что люди сами между собой иногда договориться на этот счет не могут, а как договорятся, так потом, через 100 лет, приходит новый человечишка, и переворачивает наше понимание реальности с ног на голову...
Прикольно. Жду классификацию ошибок промптинга! Желательно циклом разбить, информации много я так полагаю :)
Одинаковый промпт даёт разный результат у разных моделей (а их мильоны), так как обучены они по-разному (сюда же отнесём и всякого рода уменьшения размеров). Да ещё и модели постоянно обновляются. В общем, может оказаться, что классификация устареет к моменту публикации.
Одинаковый промпт даёт разный результат у разных моделей (а их мильоны), так как обучены они по-разному (сюда же отнесём и всякого рода уменьшения размеров)
Одинаковый промпт дает разный результат даже у одной и той же модеди. Ровно про это статья и написана...
А в классификацию я уже сейчас могу добавить около 5-7 категорий еще, особенно сильно развивается пятая группа, так как количество механизмов в окружении LLM растет экспоненциально. Я наткнулся на новые виды галлюцинаций уже прям перед публикацией, когда проводил сравнение с англоязычным интернетом. Просто решил не уходить на второй круг
Спасибо за статью!
Это буквально статья о том, что в реальности модель умеет примерно НИЧЕГО! Но все делают вид, что это человечество какое-то кривое, а не модель - полная ерунда.
Ну вот прикиньте, у вас есть целая профессия, к примеру, математик. Не все люди в мире математике, да им и не надо. Но часть людей - математики. Они учат какие-то теоремы, решают конкретные задачи. Учатся этому какое-то время
А теперь про LLM. Маркетологи говорят: вот вам LLM, можете общаться с ней как с живым человеком обо всем, что вам нравится. А в итоге, чтобы добиться хоть какого-то полезного результата, нужно читать полотна подобного текста. Следовательно, правильное использование модели - это тоже профессия. И это профессия, в которой вам может понадобиться модель, которая предсказывает следующее слово (привет всем от цепей Маркова и n-грамм, кстати)
Вот прикиньте, если бы вам дали нейронку, которая должна находить крокодилов на картинке, вы загружаете в нее тысячу фотографий, а она на каждой вас что-то спрашивает или каждый раз меняет свои представления о крокодилах, как ей нравится
Так правильное использование LLM - это и есть один из обязательных навыков будущего. Уметь добиваться от нее желаемых целей, уметь диагностировать ее сбои, уметь настраивать ее точность, понимать ее механику и принципы работы. Все это навыки, которые нужны будут в будущем так же, как сейчас нужно вождение или навыки работы с компьютером.
Умение настраивать ПК (установка виндоус, драйверов, работа в микрософт офис и т.п.) - это навыки обращения с технологиями.
Умение добиваться желаемого от LLM - это навыки укрощения хаоса вероятностей. Да, «трансформеры» всего лишь предсказывают следующий токен. Но это не значит, что на этот процесс нельзя повлиять.
"Умение добиваться желаемого от LLM" - это время впустую)
Я помню ещё году так в 2002 умение пользоваться офисом считалось недостижимым. Выпускались огромные книги. Также как и по использованию Виндоус. НО! С тех пор использование винды и офиса стало намного легче, потому что учтены ошибки прошлого. Да и потому что пользователям реально нужно 10% потенциала офиса. Остальное гуглится за минуту. Это я к чему. Программы должны упрощать жизнь людей, а не создавать новые) да и к тому же, чтобы программа прижилась, должно смениться поколение. Я освоил базовое использование компьютера в 4 года. Кто-то не может и в 54 года это сделать
я бы сказал, что программы должны не упрощать жизнь людей, а открывать новые горизонты и новые возможности. И LLM это делают лучше, чем почти все изобретения прошлого.
Упрощает ли это жизнь? С учетом того, сколько LLM сжирают электричества... я бы так не сказал. Жизнь и технологии усложняются в геометрической прогрессии.
Нейронку невозможно «настроить правильно». «Как сейчас получилось — „правильно“ или „неправильно“» — решает оператор. То есть внешний (по отношению к сети) актор.
Хороший рабор, особенно пункт 4.1 тут описание 100 из 100, у меня были мысли что он (ллм) потом по етим описаниям тянет глюки) Есть ещё такие слова "без магии", "будем честны", и ещё много слов "паразитов".

Классификация галлюцинаций LLM | «Врага нужно знать в лицо»