Спасибо за отзыв, рад, что для вас это было полезно! С моделями мы постоянно экспериментируем и пробуем разные на всех этапах обработки запроса. Также, при выборе модели, подходящей под использование на том или ином шаге мы учитываем сложность задачи - например, для перевода технических названий колонок на русский язык с учетом контекста запроса мы выбрали использование более легковесной модели: Qwen3-4B, чтобы ускорить работу системы. Для сложных этапов как, например, генерация SQL, мы используем модели побольше. Одна из последних, которую взяли в работу после тестирования качества - Qwen3-Coder-30B-A3B-Instruct. Она оказалась на одном уровне по качеству с Qwen3-32B, однако из-за MOE архитектуры заметно быстрее на инференсе.
Спасибо за отзыв, рад, что для вас это было полезно! С моделями мы постоянно экспериментируем и пробуем разные на всех этапах обработки запроса. Также, при выборе модели, подходящей под использование на том или ином шаге мы учитываем сложность задачи - например, для перевода технических названий колонок на русский язык с учетом контекста запроса мы выбрали использование более легковесной модели: Qwen3-4B, чтобы ускорить работу системы. Для сложных этапов как, например, генерация SQL, мы используем модели побольше. Одна из последних, которую взяли в работу после тестирования качества - Qwen3-Coder-30B-A3B-Instruct. Она оказалась на одном уровне по качеству с Qwen3-32B, однако из-за MOE архитектуры заметно быстрее на инференсе.