Pull to refresh
4K+
2
Виктор Кузьминов@gptctrlc

User

5
Rating
2
Subscribers
Send message

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Level of difficultyMedium
Reading time14 min
Reach and readers7.1K

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов!

Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным.

Читать далее?

Information

Rating
1,154-th
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity

Specialization

ML разработчик
Средний
From 200,000 ₽
Linux
Python
Docker
PyTorch
Scikit-learn
NumPy
Deep Learning
Обработка естественного языка
Алгоритмы и структуры данных
Математика