Комментарии 4
Спасибо за статью. Хотелось бы еще примеров удачных SLM для конкретных задач.
В малых языковых на 1 место нужно было поставить qwen 8b. Остальные перечисленные плохо работают с русским языком. Только на этой неделе тестировал самые популярные SLM и был разочарован их слабой работой с русским языком. Для нормальной работы им нужно прикручивать переводчик запросов на английский, отправку запроса и обратный перевод на русский.
Здравствуйте! Согласен - вообще SLM из-за малого количества параметров в целом плохо работают на нескольких языках, и могут вообще отказываться отвечать если язык вопроса отличается от языка обучения (чаще всего - английский). Это логично, из-за малого размера им банально "не хватает емкости" для запоминания многих языков.
В этой статье мы использовали наш опыт главным образом с международных проектов, потому и примеры были подобраны соответствующе - модели либо общались на английском, либо использовались "под капотом" для служебных функций, без непосредственного общения с пользователем (потому можно все делать на английском языке). Если мы выбираем модель под русскоговорящих пользователей разумеется стоит присматриваться к другим малым моделям - тем же малым моделям от Яндекса например
Языковые модели для бизнеса: сравниваем малые (SLM) и большие (LLM) модели