Вышла Qwen3-Coder-Next: модель с открытыми весами для кодинг-агентов / Хабр

Команда Qwen представила Qwen3-Coder-Next — языковую модель с открытыми весами, разработанную специально для программирующих агентов и локальной разработки. Она построена на базе Qwen3-Next-80B-A3B-Base, в которой используется новая архитектура с гибридным механизмом внимания и MoE (Mixture of Experts, «смесь экспертов»). Qwen3-Coder-Next прошла масштабное агентное обучение на данных, включающих синтез исполняемых задач, взаимодействие со средой и обучение с подкреплением, благодаря чему получила сильные навыки программирования и агентного поведения при заметно более низкой стоимости инференса.

Масштабирование агентного обучения

Вместо того чтобы полагаться только на масштабирование числа параметров, Qwen3-Coder-Next делает акцент на масштабировании обучающих сигналов для агентного поведения. Мы обучаем модель на больших коллекциях проверяемых задач по программированию, связанных с исполняемыми окружениями, чтобы модель могла учиться напрямую на обратной связи от среды. Это включает:

Продолженное предобучение на данных, ориентированных на код и работу агентов
Обучение с учителем на данных с высококачественными траекториями агента
Обучение специализированных экспертов по доменам (например, разработка ПО, QA, веб/UX)
Дистилляцию экспертов в единую модель, готовую к развёртыванию

Этот рецепт делает упор на рассуждения на длинном горизонте, использование инструментов и восстановление после сбоев при выполнении, что критично для реальных программирующих агентов.

Результаты на бенчмарках для программирующих агентов

Результаты на агентно-ориентированных бенчмарках

На рисунке ниже показаны результаты на нескольких широко используемых бенчмарках для программирующих агентов, включая SWE-Bench (Verified, Multilingual и Pro), TerminalBench 2.0 и Aider.

Рисунок показывает, что:

Qwen3-Coder-Next набирает более 70% на SWE-Bench Verified при использовании обвязки SWE-Agent.
Результаты остаются к��нкурентоспособными в многоязычных настройках и на более сложном бенчмарке SWE-Bench Pro.
Несмотря на небольшое активное число параметров, модель сопоставима или превосходит ряд значительно более крупных моделей с открытым исходным кодом по агентно-ориентированным оценкам.

Как видно на рисунке ниже, наша модель показывает сильные результаты на SWE-Bench Pro при масштабировании числа ходов агента, что подтверждает её способность к рассуждениям на длинном горизонте в многоходовых агентных задачах.

Компромисс «эффективность — качество»

Этот график показывает, как Qwen3-Coder-Next достигает улучшенного компромисса между эффективностью и качеством (Pareto).

Сравнение ясно демонстрирует историю про эффективность:

Qwen3-Coder-Next (3B активных параметров) показывает качество на SWE-Bench-Pro, сопоставимое с моделями, у которых активных параметров в 10–20 раз больше.
Хотя проприетарные модели с полным вниманием по-прежнему лидируют по абсолютным показателям, Qwen3-Coder-Next находится на сильной границе Парето для экономически эффективного развёртывания агентов.

Демо

Небольшую и быструю модель для кода можно интегрировать в разные прикладные сценарии. Примеры с OpenClaw, Qwen Code, Claude Code, веб-разработкой, использованием браузера, Cline и т. д. можно посмотреть на странице оригинала.

Источник: qwen.ai

Освоить работу с AI-агентами и научиться интегрировать их в реальные проекты можно на курсе «AI-агенты: продвинутое внедрение и использование». Также приходите на бесплатные демо-уроки:

10 февраля 20:00. «Тестирование и валидация AI-агентов: от RAG-прототипа к управляемой интеллектуальной системе». Записаться
17 февраля 20:00. «Обзор фреймворков для создания агентов». Записаться

Больше открытых уроков смотрите в посте.

Вышла Qwen3-Coder-Next: модель с открытыми весами для кодинг-агентов

Масштабирование агентного обучения

Результаты на бенчмарках для программирующих агентов

Демо

Другие новости

Информация