Pull to refresh

Comments 6

А почему для реранкинга не использовать локальные модели из семейства Qwen? Они маленькие, шустрые и весьма хороши в реранкинге и запускать можно через llama.cpp

При разборе RAG, стоило найти современные решения ряда проблем.

Например:

Реальное решение проблемы чанкования.

Увидеть, что часть описанного вами в реальности работает плохо и как это решить. В частности использование RAG в медицине. То есть разделив на базовую часть и практическую.

Выше два примера исследований, но их можно привести больше.

Лучше убирать часть воды (LLM любит раздувать), и этот текст потратить на разбор современных исследований/решений. Так как часть из них на английском и не скоро дойдут до русскоязычной аудитории.

Спасибо за обратную связь, я учту

Отличная обзорная статья, спасибо.

Как мне кажется, неправильно только на 4 шаге добавлять использование метаинформации, особенно в больших компаниях. Лучше сразу смотреть на предметную область через призму структурированных и семантических составляющих исходных данных. Они сильно помогают как на этапе оценки качества работы системы, так и для выбора пути развития.

А как метаинформацию раньше добавить?

вообще конечно логично, если чат-бот на какой-то странице (например карточка товара), то отправлять в rag как минимум название страницы.

Sign up to leave a comment.

Articles