Команда Qwen представила Qwen3-Coder-Next — языковую модель с открытыми весами, разработанную специально для программирующих агентов и локальной разработки. Она построена на базе Qwen3-Next-80B-A3B-Base, в которой используется новая архитектура с гибридным механизмом внимания и MoE (Mixture of Experts, «смесь экспертов»). Qwen3-Coder-Next прошла масштабное агентное обучение на данных, включающих синтез исполняемых задач, взаимодействие со средой и обучение с подкреплением, благодаря чему получила сильные навыки программирования и агентного поведения при заметно более низкой стоимости инференса.

Масштабирование агентного обучения

Вместо того чтобы полагаться только на масштабирование числа параметров, Qwen3-Coder-Next делает акцент на масштабировании обучающих сигналов для агентного поведения. Мы обучаем модель на больших коллекциях проверяемых задач по программированию, связанных с исполняемыми окружениями, чтобы модель могла учиться напрямую на обратной связи от среды. Это включает:

  • Продолженное предобучение на данных, ориентированных на код и работу агентов

  • Обучение с учителем на данных с высококачественными траекториями агента

  • Обучение специализированных экспертов по доменам (например, разработка ПО, QA, веб/UX)

  • Дистилляцию экспертов в единую модель, готовую к развёртыванию

Этот рецепт делает упор на рассуждения на длинном горизонте, использование инструментов и восстановление после сбоев при выполнении, что критично для реальных программирующих агентов.

Результаты на бенчмарках для программирующих агентов

Результаты на агентно-ориентированных бенчмарках

На рисунке ниже показаны результаты на нескольких широко используемых бенчмарках для программирующих агентов, включая SWE-Bench (Verified, Multilingual и Pro), TerminalBench 2.0 и Aider.

Бенчмарки Qwen3 Coder Next
Бенчмарки Qwen3 Coder Next

Рисунок показывает, что:

  • Qwen3-Coder-Next набирает более 70% на SWE-Bench Verified при использовании обвязки SWE-Agent.

  • Результаты остаются к��нкурентоспособными в многоязычных настройках и на более сложном бенчмарке SWE-Bench Pro.

  • Несмотря на небольшое активное число параметров, модель сопоставима или превосходит ряд значительно более крупных моделей с открытым исходным кодом по агентно-ориентированным оценкам.

Как видно на рисунке ниже, наша модель показывает сильные результаты на SWE-Bench Pro при масштабировании числа ходов агента, что подтверждает её способность к рассуждениям на длинном горизонте в многоходовых агентных задачах.

Ходы на SWE-Bench Pro
Ходы на SWE-Bench Pro

Компромисс «эффективность — качество»

Этот график показывает, как Qwen3-Coder-Next достигает улучшенного компромисса между эффективностью и качеством (Pareto).

Главное изображение Qwen3 Coder Next
Главное изображение Qwen3 Coder Next

Сравнение ясно демонстрирует историю про эффективность:

  • Qwen3-Coder-Next (3B активных параметров) показывает качество на SWE-Bench-Pro, сопоставимое с моделями, у которых активных параметров в 10–20 раз больше.

  • Хотя проприетарные модели с полным вниманием по-прежнему лидируют по абсолютным показателям, Qwen3-Coder-Next находится на сильной границе Парето для экономически эффективного развёртывания агентов.

Демо

Небольшую и быструю модель для кода можно интегрировать в разные прикладные сценарии. Примеры с OpenClaw, Qwen Code, Claude Code, веб-разработкой, использованием браузера, Cline и т. д. можно посмотреть на странице оригинала.

Источник: qwen.ai


Освоить работу с AI-агентами и научиться интегрировать их в реальные проекты можно на курсе «AI-агенты: продвинутое внедрение и использование». Также приходите на бесплатные демо-уроки:

  • 10 февраля 20:00. «Тестирование и валидация AI-агентов: от RAG-прототипа к управляемой интеллектуальной системе». Записаться

  • 17 февраля 20:00. «Обзор фреймворков для создания агентов». Записаться

Больше открытых уроков смотрите в посте.