Комментарии 4
интересно. а если сравнить вариант "ответ в с RAG", а все отказы отдельным запросом пытаться прогнать без RAG?
Обрезку словаря пробовали? В теории если оставить только пятерку основных языков и потом дообучать на русском то должно получиться лучше для ру бенча. Но это из тыканья пальцем в небо, в этих условиях наверное больше навредит, просто смотрю эту тему сейчас.
Возможно сработает подмешивание исходных данных на которых модель обучалась(или схожих) к вашим чтобы уменьшить размытие.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо