akzhankalimatov Apr 29 at 12:10

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Medium

12 min

11K

Artificial IntelligenceText editors and IDEs * Product Management * Project management * Programming *

Review

+14

Comments 6

nikulin_krd Apr 29 at 12:50

А почему для реранкинга не использовать локальные модели из семейства Qwen? Они маленькие, шустрые и весьма хороши в реранкинге и запускать можно через llama.cpp

remindscope Apr 29 at 12:55

Полезный материал, спасибо

proxy3d Apr 29 at 16:07

При разборе RAG, стоило найти современные решения ряда проблем.

Например:

Реальное решение проблемы чанкования.

Увидеть, что часть описанного вами в реальности работает плохо и как это решить. В частности использование RAG в медицине. То есть разделив на базовую часть и практическую.

Выше два примера исследований, но их можно привести больше.

Лучше убирать часть воды (LLM любит раздувать), и этот текст потратить на разбор современных исследований/решений. Так как часть из них на английском и не скоро дойдут до русскоязычной аудитории.

akzhankalimatov Apr 30 at 10:30

Спасибо за обратную связь, я учту

penguinlolo May 1 at 11:32

Отличная обзорная статья, спасибо.

Как мне кажется, неправильно только на 4 шаге добавлять использование метаинформации, особенно в больших компаниях. Лучше сразу смотреть на предметную область через призму структурированных и семантических составляющих исходных данных. Они сильно помогают как на этапе оценки качества работы системы, так и для выбора пути развития.

Cordekk May 4 at 06:06

А как метаинформацию раньше добавить?

вообще конечно логично, если чат-бот на какой-то странице (например карточка товара), то отправлять в rag как минимум название страницы.