Подскажите, если вы используете витальность, то для каждого проекта вы до обучаетесь? Т е у вас нет такого, что одна модель может поддерживать все решения?
Подскажите, а как вы комбинировали подокументную и почанковую релевантность для обучения retrieval . Например, документ, может быть большим и странно все помечать как позитив.
И вопрос про DPO- дает ли он прирост качества? и действительно ли он нужен, возможно стоит ограничиться только SFT?
Подскажите, если вы используете витальность, то для каждого проекта вы до обучаетесь? Т е у вас нет такого, что одна модель может поддерживать все решения?
Подскажите, а как вы комбинировали подокументную и почанковую релевантность для обучения retrieval . Например, документ, может быть большим и странно все помечать как позитив.