Pull to refresh
1
Григорий Шевченко@Gregory_Shevchenko

AEO/GEO, AI Search, GPT/LLM-маркетинг

Send message

В статье хорошо разобрана природа галлюцинаций, но мне кажется, практический вопрос здесь даже важнее: не "почему модель ошибается", а "почему система позволяет ошибке выглядеть как готовый ответ".

Проблема LLM не только в том, что она может выдать неверный факт, а в том, что она почти не умеет сама обозначать границу своей надежности. Поэтому для реальных сценариев недостаточно просто сказать модели «не выдумывай» или прикрутить RAG — нужен внешний контур доверия: проверка источников, confidence threshold, отказ от ответа при слабом retrieval, логирование спорных мест и, где нужно, human-in-the-loop.

Иначе мы получаем не «умного помощника», а интерфейс, который маскирует неопределенность под уверенность. На мой взгляд, это и есть главный риск: не сама ошибка, а ее незаметность для пользователя

ИИ-поиск сейчас критикуют немного не туда. Проблема не в том, что он ошибается ~10% времени, проблема в том, что эти 10% выглядят так же уверенно, как и остальные 90%.

LLM не «ищет истину», а оптимизирует правдоподобие ответа на основе шумных и противоречивых данных. В этом смысле он очень похож на junior-аналитика: собрал, обобщил, и погнали дальше. Ошибки тут не баг, а свойство подхода.

Настоящий риск возникает на уровне интерфейса. Google (и не только) убирает трение: раньше было 10 ссылок и ты понимал, что надо сравнивать, теперь видишь «готовый ответ». Это создает иллюзию завершенности и снижает мотивацию проверять источники. Не потому что люди глупые, а потому что так устроен UX.

И вот здесь 10% превращаются из «нормальной погрешности» в системную проблему. Не из-за масштаба ошибок, а из-за их незаметности.

При этом важно не скатываться в крайность. Для большинства повседневных задач (сравнить товары, быстро разобраться в теме, найти варианты) даже 85–90% точности — огромный выигрыш во времени. Просто это инструмент с другим профилем надежности: его сила в скорости и обобщении, а не в гарантированной корректности.

В общем, как по мне, AI-поиск это не «замена проверки», а «первый проход по информации». И чем раньше это станет частью пользовательской привычки, тем меньше будет разочарований.

Information

Rating
Does not participate
Date of birth
Registered
Activity

Specialization

Директор по маркетингу, ML разработчик