Спасибо за статью! Как Вы считаете, RAG в агенте лучше применять как tool для получения ответа на вопрос, либо для получения релевантных чанков (без этапа генерации)? Кажется, что релевантные чанки могут быть полезнее, чем сам ответ, но излишняя информация может агента сбить с пути
Если позволяют ресурсы - https://huggingface.co/BAAI/bge-reranker-v2-m3 отличная модель реранкера (с динамической квантизацией тоже показывает очень хорошие результаты), с ней метрики значительно подрастут. А перед реранкером по-хорошему поиск комбинацией BM25 и Embeddings
Спасибо за статью! Как Вы считаете, RAG в агенте лучше применять как tool для получения ответа на вопрос, либо для получения релевантных чанков (без этапа генерации)? Кажется, что релевантные чанки могут быть полезнее, чем сам ответ, но излишняя информация может агента сбить с пути
Если позволяют ресурсы - https://huggingface.co/BAAI/bge-reranker-v2-m3 отличная модель реранкера (с динамической квантизацией тоже показывает очень хорошие результаты), с ней метрики значительно подрастут. А перед реранкером по-хорошему поиск комбинацией BM25 и Embeddings
Отдельная боль таких документов - таблицы, которые могут иметь разные структуры и размеры