Pull to refresh
258.55
BotHub
Аргегатор нейросетей: ChatGPT, Claude, Midjourney

Qwen2-Math — Alibaba Cloud выпустила серию LLM для решения математических задач любой сложности

Reading time1 min
Views3.2K

Alibaba Cloud представила Qwen2-Math, новую серию LLM с открытым исходным кодом, предназначенную для решение математических задач. Модели основаны на платформе Qwen2, которая уже используется многими компаниями, преимущественно в Китае.

Новые возможности для математических вычислений

Qwen2-Math — это набор специализированных моделей, обученных на английском языке для решения математических задач разной сложности. Флагманская модель Qwen2-Math-72B-Instruct показывает высокую точность (84%) на бенчмарке MATH, содержащем 12500 сложных математических задач. Эта модель превосходит по качеству работы ИИ-модели от OpenAI, Anthropic и Google.

Высокая точность на разных уровнях сложности

Qwen2-Math демонстрирует отличные результаты не только на комплексных тестах, но и на бенчмарках для школьной (GSM8K — 96.7%) и университетской (College Math — 47.8%) математики.

Примечательно, что даже самая компактная модель в серии, Qwen2-Math-1.5B, показывает результаты, близкие к моделям, значительно превосходящим её по размеру.

Практическое применение математических LLM

Qwen2-Math открывает новые возможности для использования ИИ в задачах, требующих решения математических задач. Alibaba Cloud предлагает гибкие условия лицензирования, что делает Qwen2-Math доступным для стартапов, бизнеса и научных организаций.

В будущем разработчики планируют добавить поддержку других языков и усовершенствовать алгоритмы решения задач. Это сделает Qwen2-Math доступным для более широкой аудитории и откроет новые возможности для исследований и практических применений математики.

Попробовать модель на huggingface самостоятельно можно здесь.

Tags:
Hubs:
Total votes 3: ↑3 and ↓0+3
Comments9

Other news

Information

Website
bothub.chat
Registered
Founded
Employees
2–10 employees
Location
Россия