Как стать автором
Поиск
Написать публикацию
Обновить

Языковые модели для бизнеса: сравниваем малые (SLM) и большие (LLM) модели

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров3K
Всего голосов 5: ↑4 и ↓1+6
Комментарии4

Комментарии 4

Спасибо за статью. Хотелось бы еще примеров удачных SLM для конкретных задач.

Добрый день! Спасибо, что прочитали статью. Рады, что она вам понравилась. Сейчас SLM в тренде — возможно, в будущем напишем об этом. Обязательно передадим автору.

В малых языковых на 1 место нужно было поставить qwen 8b. Остальные перечисленные плохо работают с русским языком. Только на этой неделе тестировал самые популярные SLM и был разочарован их слабой работой с русским языком. Для нормальной работы им нужно прикручивать переводчик запросов на английский, отправку запроса и обратный перевод на русский.

Здравствуйте! Согласен - вообще SLM из-за малого количества параметров в целом плохо работают на нескольких языках, и могут вообще отказываться отвечать если язык вопроса отличается от языка обучения (чаще всего - английский). Это логично, из-за малого размера им банально "не хватает емкости" для запоминания многих языков.

В этой статье мы использовали наш опыт главным образом с международных проектов, потому и примеры были подобраны соответствующе - модели либо общались на английском, либо использовались "под капотом" для служебных функций, без непосредственного общения с пользователем (потому можно все делать на английском языке). Если мы выбираем модель под русскоговорящих пользователей разумеется стоит присматриваться к другим малым моделям - тем же малым моделям от Яндекса например

Зарегистрируйтесь на Хабре, чтобы оставить комментарий