Спасибо за вопрос! Именно с "deepvk/USER-bge-m3" эксперименты не проводились. Но были эксперименты с аналогичном сетапе с русскоязычными LLM внутренней разработки (на заданиях с видео также страдали от проблем, описанных в статье). Качество генерации LLaMA 3.1 на русском языке (до обучения на видео) тестировали и посчитали достаточным для демонстрации описанных явлений.
Спасибо за вопрос! Именно с "deepvk/USER-bge-m3" эксперименты не проводились. Но были эксперименты с аналогичном сетапе с русскоязычными LLM внутренней разработки (на заданиях с видео также страдали от проблем, описанных в статье). Качество генерации LLaMA 3.1 на русском языке (до обучения на видео) тестировали и посчитали достаточным для демонстрации описанных явлений.