
Комментарии 8
Можно сразу отметить катастрофическую непригодность специализированных моделей для кодинга. Возможно такие модели действительно быстро набирают код, но эта способность бесполезна в реальной работе. Qwen3 Coder Next категорически отказывается выполнять какие-либо инструкции системного промпта, она его попросту игнорирует, а модель того же семейства но общего назначения – ощутимо лучше.
Ваши выводы про Qwen3 Coder Next не подтверждаются моей практикой. Подключите эту же модель через LM Studio к Claude Code, обозвав ее Claude Sonnet, и вы увидите, что она прекрасно работает, используя абсолютно все возможности самого Claude Code. В вашем случае проблема кроется не в самих моделях, а в Qwen Code и его настройках.
Вообще Qwen3 Coder Next специально натренирована на агентные сценарии, взаимодействие со средой и использование инструментов. То, что у вас она наотрез отказывается работать, говорит только о том, что скорее всего сломан механизм передачи инструкций. Насколько я помню, у Qwen Code он завернут в специфические xml теги, то есть нестандартный. Вам определенно стоит покопать именно в эту сторону.
не подтверждаются моей практикой
А пруфы будут, или мы просто должны поверить вашей «практике»?
То, что у вас она наотрез отказывается работать
Отказывается работать, и игнорирует инструкции системного промпта – это совершенно разные вещи. Для агентских систем reasoning обязателен, и проведенный мной эксперимент это подтверждает. Имея описания минимум двух релевантных скилов, Qwen3 Coder Next неспособен прийти к выводу, что надо бы их использовать. То есть ему не хватает умений даже инструменты свои использовать, не говоря уже о выполнении комплексных, многоступенчатых задач.
А пруфы будут, или мы просто должны поверить вашей «практике»?
https://www.youtube.com/watch?v=dG4WwlA4ym4
Имея описания минимум двух релевантных скилов, Qwen3 Coder Next неспособен прийти к выводу, что надо бы их использовать. То есть ему не хватает умений даже инструменты свои использовать, не говоря уже о выполнении комплексных, многоступенчатых задач.
У меня дообученная сеть на его основе (под мою специфику) работает прямо в Apache NetBeans IDE с использованием всех MCP инструментов, от fzf/ripgrep поиска по проекту до работы с сырыми буферами самой IDE, те модель понимает не только какой проект открыт но и какие файлы сейчас открыты в самой IDE, в каких из них есть изменения сделанный прямо сейчас человеком, но еще не сохранены, может искать по актуальным версиям спецификаций и осуществлять сборку проектов.
Вы просто не умеете его готовить. Я специально написал это так категорично, чтобы дать вам заряд энергии выйти из отрицания и разобраться почему же он не работает у вас. Определенно, стоит это сделать тк на данный момент это одна из лучших агентских MoE сетей с открытыми весами в диапазоне до 100B параметров.
Из ваших комментариев я могу сделать только один вывод: статью вы не читали.
Или вы не читали мои комментарии, эта модель прекрасно работает и с системным промтом и с указанными tools и cо skills.md который также становится частью системного промта. Более того, именно для этого она и создавалась.
Не знаю, кто эти ребята что плюсуют ваши комментарии, видимо ваши друзья. Других объяснений этому поведению нет. Теперь по существу:
Ваши выводы про Qwen3 Coder Next не подтверждаются моей практикой
Не интересуют меня ваши субъективные ощущения. Приведите пруфы и цифры, а не ссылку на ютюб.
В вашем случае проблема кроется не в самих моделях, а в Qwen Code и его настройках
Вы прочитали статью, но не заметили, что добрая ее половина как раз об этом? Вы даже TL;DR пропустили, давайте напомню:
TL;DR: CLI-агенты галлюцинируют даже с мощными моделями, потому что системные промпты раздуты лишними примерами, повторами и нерелевантными терминами. Это математически бьёт по вниманию модели и не даёт того эффекта, который обещают best-practices. Я форкнул Qwen Code, вычистил системные промпты, и на 4 моделях получил стабильный вызов нужных скиллов, меньше галлюцинаций и на 35-53% сократил расход токенов. Без потери качества.
Дальше вы пишите:
Насколько я помню, у Qwen Code он завернут в специфические xml теги
Давайте приведу еще один отрывок из статьи, которую вы читали:
Интересно, что доступные скилы в Qwen Code пакуются в некие специальные XML директивы (назначение которых мне неизвестно), и отправляются как сообщение пользователя а не системы (что похоже на баг).
Как же вы статью то читали? Точнее какую? Эту точно нет.
Вам определенно стоит покопать именно в эту сторону.
В какую? Не в сторону ли инструмента, то есть CLI, о чем как раз вторая половина статьи? О том куда я копал, зачем, что изменил и какие результаты получил?
Вы просто не умеете его готовить. Я специально написал это так категорично, чтобы дать вам заряд энергии выйти из отрицания и разобраться почему же он не работает у вас.
Пафос и демагогия.
Мой опыт - Qwen3 Coder Next неюзабельна. Qwen 3.6 сильно лучше - использую в повседневной практике вайбкодинга.
Галлюцинации: почему LLM «тупеют» от «умных» промптов