Pull to refresh
16K+
0
Real_Egor@Real_Egor

Функциональный архитектор | архитектор смыслов

13,6
Rating
6
Subscribers
Send message

Классификация галлюцинаций LLM | «Врага нужно знать в лицо»

Level of difficultyMedium
Reading time22 min
Reach and readers11K

В этой статье я постарался выписать все то, что понял про «галлюцинации» LLM за время их изучения и практики борьбы с ними. Будучи архитектором по профессии и занудой по природе, я изначально их классифицировал и искал способы, как галлюцинации победить / укротить. В этой статье я хочу поделиться тем, что мне удалось накопать.

Сопоставимого по охвату практико-ориентированного материала на русском я не нашёл. На английском есть более полные академические обзоры, но они опубликованы на arXiv и написаны для ML-исследователей.

Без академичности, описано на живом языке, надеюсь, будет понятно всем, кто осилит объем. Кратко написать статью не вышло, все же нужно показать, чем одна категория отличается от другой, а также предложить «как с ними можно бороться».

Классификацию галлюцинаций я разбил на 5 групп, на фундаментальном уровне выделив «главных виноватых»:
— Проблема в весах, а виновато предобучение
— Проблема в промпте, а виноват пользователь
— Проблема в самой архитектуре LLM, виновата жизнь
— Проблема в дрессировке RLHF, а виноваты горе-учителя
— Проблема в окружении LLM, а виноваты все, кто это окружение разрабатывает / интегрирует

Читать далее

На что реально способна LLM или «нестандартные подходы к промптам, которые дают неожиданный результат»

Level of difficultyMedium
Reading time5 min
Reach and readers6.9K

В этой статье я на одном простом примере покажу, как перестать ковыряться в словах и начать дирижировать эмоциями читателя. Мы возьмем самую обычную задачу, выбьем нейросеть из «банальщины» и заставим текст искрить. Никаких унылых ролей в духе «представь, что ты копирайтер». Вместо этого мы пустим в ход неочевидные инструменты и неожиданные способы использования LLM, чтобы научиться управлять тем, что обычно остается за кадром

Читать далее

re!think it: Как я уместил корпоративный бэкенд в один промпт (История сборки)

Level of difficultyMedium
Reading time10 min
Reach and readers7.1K

Краткая история о том, как утренняя переписка с моделью превратилась в создание системного промпта на 1000 токенов. Внутри заложен алгоритм размышлений, позволяющий модели работать вдумчиво и объясняющий ей на языке формул, как человек принимает решения (исходя из своего личного опыта и понимания).

То, чего я не ожидал на старте — на выходе получилась очень компактная системная инструкция. В действительности она заменяет огромное количество функций, которые ИИ-гиганты выстраивают вокруг моделей.

Читать далее

Как спасти ИИ в эпоху, когда ИИ убивает сам себя?

Level of difficultyEasy
Reading time4 min
Reach and readers5.2K

«Все крупные корпорации и социальные сети уже давно хотят помечать контент, созданный искусственным интеллектом, отдельным специальным признаком. Безусловно, можно говорить о том, что это делается ради заботы о пользователях — чтобы люди не сидели бесконечно и не потребляли абсолютно одинаковый контент. Но у этой инициативы есть и совершенно эгоистичные цели: платформам жизненно необходимо физически отделить контент, созданный живыми людьми, от материалов, сгенерированных нейросетями».

Читать далее

Information

Rating
589-th
Location
Вьетнам
Date of birth
Registered
Activity

Specialization

Ontology Engineer, Архитектор 1С
Ведущий
From 5,000 $
ООП
Базы данных
Алгоритмы и структуры данных
Проектирование баз данных