Обновить

Комментарии 17

Я за последние три дня на бесплатных Qwen3.6 потратил 200 млн токенов. Мне Qwen3.6 понравился гораздо больше, чем Claude Sonnet-4.5. По моему ощущению, Qwen3.6 это игрок высшей лиги:)
Использовал Qwen3.6 через деcктопную версию OpenCode.




Прогонял тест конверсии идеи из С# кода в реализацию на другом фреймворке в Python

Тесты запускал в Roo Code под VS Code, сперва составить план, потом реализовать план.

Образец брал реализацию GPT5.4 и потом так-же с помощью GPT5.4 сравнивал результаты разных моделей. Получилось порядок по качеству. Cортировка по убыванию качества реализации и количеству ошибок в реализации. Ошибка это неправильная реализация алгоритмов расчета.

  • GPT5.4-Medium - Sonnet 4.6 - качество примерно на одинаковом уровне

  • GPT5-mini

  • Qwen3.5-122b Q4-КМ локально 12tok/sec

  • Qwen3-coder-next Q4-КМ локально 26tok/sec

  • Haiku 4.5

  • Qwen3-235b Q3-KS локально 7 tok/sec

  • gpt-oss-120b - локально 24 tok/sec

  • MiniMax-M2.5 Q3-KS локально 15tok/sec

  • Qwen3.6

В общем как-то так получилось, локальная машина i7-265K, 128Gb DDR5, RTX3090-1шт

Суммарно 1день на это потратил, но теперь хоть примерно понятно, что мне пдоходит, как резервный вариант.

Получилось Qwe3.5-122b оптимально, но не очень быстро, зато мультимодальная, либо если надо быстро то Qwen3-coder-next.

Ну или можно GPT5-mini гонять, она пока бесплатная в Github Copilot

Из семейства qwen для кода Qwen3.5-27B попробуй. ИМХО: значительно лучше работает, чем Qwen3-Coder-Next.

Анализ и код пишут на опус 4.6, на сонет запускают субагентов для более простых задач типа анализ логов, запуск сценариев.

Я может чего-то не понял, но в чем смысл статьи? Это прям какая-то статья капитана очевидность - никаких сравнений нет, просто подключаем бесплатную LLM, которая "о чудо" пишет код...

За опубликованную статьи Хабр автоматически увеличивает "карму" на 1 единицу:)

Согласен, глубокого исследования здесь нет. Статья больше для новичков: что установить, как подключить бесплатную LLM и попробовать ее без подписки. И потом уже решиться нужно покупать подписку или нет.

modelscope
500 звонков на модель в день, до 2000 звонков
Жаль, что Alibaba Cloud ужесточила высокую модель

Интересно, что примерно в это же время кило сломался, на гитхабе повалили ишью с проблемами и пометкой bug.... Совпадение?....

Возможно, но я думаю проблемы скорее вызваны большим обновлением и новой версией 7.*, я все проверял на 5.11.0. На нужную версию можно откатиться в VS Code.

Мой совет из опыта, даже не стоит пробовать кодить на этих моделях, если только чисто "время потратить".

Не знаю в чём разница, но в Visual Code можно установить Qwen Code и просто авторизоваться и можно использовать последнюю на данный момент модель без ограничений, ограничения только по контексту.

Cогласен с вами. Просто у Qwen Code только модели от Qwen. У таких решений как Kilo Code, Open Code бывают бесплатные модели от многих компаний, что иногда полезно

Да, но пока в сравнении с остальными бесплатными которые там есть, то Qwen их опережает, также можно добавить российские расширения GigaChat и от яндекса SourceCraft Code Assistant

Килокод перестал работать с квен код сегодня, после выхода 3.6 версии, выдает ошибку 400 неверный запрос. Перепробовал целый список разных моделей, ничего не получается.

Спасибо, перепроверил, действительно выдает ошибку 400. Добавил UPD в статью.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации