Обновить
4
Куляскин Михаил@alaska_bear

ML engineer

3
Подписчики
Хабр Карьера
Отправить сообщение

Спасибо за отзыв, рад, что для вас это было полезно! С моделями мы постоянно экспериментируем и пробуем разные на всех этапах обработки запроса. Также, при выборе модели, подходящей под использование на том или ином шаге мы учитываем сложность задачи - например, для перевода технических названий колонок на русский язык с учетом контекста запроса мы выбрали использование более легковесной модели: Qwen3-4B, чтобы ускорить работу системы. Для сложных этапов как, например, генерация SQL, мы используем модели побольше. Одна из последних, которую взяли в работу после тестирования качества - Qwen3-Coder-30B-A3B-Instruct. Она оказалась на одном уровне по качеству с Qwen3-32B, однако из-за MOE архитектуры заметно быстрее на инференсе.

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность

Специализация

ML разработчик