Alibaba Cloud представила Qwen2-Math, новую серию LLM с открытым исходным кодом, предназначенную для решение математических задач. Модели основаны на платформе Qwen2, которая уже используется многими компаниями, преимущественно в Китае.
Новые возможности для математических вычислений
Qwen2-Math — это набор специализированных моделей, обученных на английском языке для решения математических задач разной сложности. Флагманская модель Qwen2-Math-72B-Instruct показывает высокую точность (84%) на бенчмарке MATH, содержащем 12500 сложных математических задач. Эта модель превосходит по качеству работы ИИ-модели от OpenAI, Anthropic и Google.
Высокая точность на разных уровнях сложности
Qwen2-Math демонстрирует отличные результаты не только на комплексных тестах, но и на бенчмарках для школьной (GSM8K — 96.7%) и университетской (College Math — 47.8%) математики.
Примечательно, что даже самая компактная модель в серии, Qwen2-Math-1.5B, показывает результаты, близкие к моделям, значительно превосходящим её по размеру.
Практическое применение математических LLM
Qwen2-Math открывает новые возможности для использования ИИ в задачах, требующих решения математических задач. Alibaba Cloud предлагает гибкие условия лицензирования, что делает Qwen2-Math доступным для стартапов, бизнеса и научных организаций.
В будущем разработчики планируют добавить поддержку других языков и усовершенствовать алгоритмы решения задач. Это сделает Qwen2-Math доступным для более широкой аудитории и откроет новые возможности для исследований и практических применений математики.
Попробовать модель на huggingface самостоятельно можно здесь.