Comments 6
А почему для реранкинга не использовать локальные модели из семейства Qwen? Они маленькие, шустрые и весьма хороши в реранкинге и запускать можно через llama.cpp
Полезный материал, спасибо
При разборе RAG, стоило найти современные решения ряда проблем.
Например:
Реальное решение проблемы чанкования.
Увидеть, что часть описанного вами в реальности работает плохо и как это решить. В частности использование RAG в медицине. То есть разделив на базовую часть и практическую.
Выше два примера исследований, но их можно привести больше.
Лучше убирать часть воды (LLM любит раздувать), и этот текст потратить на разбор современных исследований/решений. Так как часть из них на английском и не скоро дойдут до русскоязычной аудитории.
Отличная обзорная статья, спасибо.
Как мне кажется, неправильно только на 4 шаге добавлять использование метаинформации, особенно в больших компаниях. Лучше сразу смотреть на предметную область через призму структурированных и семантических составляющих исходных данных. Они сильно помогают как на этапе оценки качества работы системы, так и для выбора пути развития.
10 актуальных RAG-подходов: какие реально полезны и когда их применять?