Статьи / Профиль gptctrlc / Хабр

gptctrlc 29 мар в 06:22

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Средний

14 мин

6.7K

Python * PDFМашинное обучение * Искусственный интеллектПоисковая оптимизация *

Из песочницы

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов!

Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным.

Читать далее?

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Информация

Специализация