не я имею ввиду собрать различные задачи например для RAG, пособирать промты всякие и тест кейсы для этого и провести исследование на (хотя бы 100+ примерах) для русского, английского языка, … Для задач на понимание научных статей, блогов, новостей и тд. И посмотреть какие вообще эмбеды где лучше делают репрезентации.

Думаю что вполне может потянуть на небольшую научную статью

dvgureev May 5 2024 at 19:09

Возможно, но я тут больше как практик, поэтому на сегодняшний день наиболее практичным мне кажется исходить из домено-ориентированного подхода.

Т.е. делать файнтюн эмбединга под конкретную область знаний. Но это не решит вопрос (увы) задач поиска ответа на вопросы. К сожалению "традиционный" подход: нарезать на куски, сделать вектор и потом по ним искать имеет ограничения методологические. Более 80-85% точных ответов сложно получить.

Archi_Pro Jan 20 2025 at 15:39

RAG состоит из 2 частей, векторный поиск и генерация ответа, соотвественно нужна 2 вида метрик
Один для векторного поиска второй для генератора
Для векторного поиска нужно смотреть нашелся ли релевантный кусок текста в поисковой выдачи среди претендентов и на какой месте

Для генератора оценки вручную
Как то так