Комментарии 7
Несмотря на малое количество активных параметров и хорошее теоретическое соотношение качества и эффективности, цены на api Qwen3-Next выше намного чем этот же gpt-oss-120B в целом и общем, хоть и зависит от провайдера api. А по идее должно быть сопоставимо. Значит инференс модели ещё не оптимизирован.
Пока похоже не сильно отличается от обычной Qwen3-Next, по крайней мере основная проблема, с которой постоянно сталкиваюсь, такая же: при анализе кода находит синтаксические ошибки там, где их нет, и в качестве исправления предлагает ту же строку, в которой якобы и нашлась ошибка. На других моделях такое не наблюдал.
Типа такого:
Syntax Error in Function Signature (Line 53) Issue:
def init(self, config_path: str = None): - incorrect type hint and colon placement
Fix: Corrected to def init(self, config_path: str = None):
Syntax Error in File Opening (Line 65)
Issue:
with open(self.config_path, 'r', encoding='utf-8') as f: - missing opening parenthesis
Fix: Added missing parenthesis
Слова "анализ" и "проанализировать" и их английские аналоги являются слишком сильно обобщёнными. Лучше формулировки вида "проинспектируй код на уязвимости" или ещё более детализированный промпт. Малодетализованные вопросы лучше отдавать более крупным моделям
Все оказалось проще - это баг в llama.cpp, который вот только сейчас исправляют.
Да, действительно подобное поведение наблюдается. Проверял на qwen3-next-80b-a3b-instruct и С++ коде, но расширенный промпт может как минимум частично купировать проблему. Я использовал следующий промпт: "Проинспектируй код на ошибки и неточности; предложи исправления. Ошибка - это когда явно найдена неточность и ясно что фрагмент работает не так как нужно. Если фрагмент кода просто подозрительный, то это не ошибка, так как ты не сможешь чётко пояснить в чём заключается ошибка." Откровенный бред с одинаковыми строками (предположительно ошибочной и исправленной) пропал. Как временное решение до починки llama.cpp вполне сойдёт, так как остальные рассуждения модели вполне нормальные мне показались.
а что такое swы агент?
Не силён в языковых моделях. По приколу в lm studio скачал, запустил. Взял страницу с вики 18 премия грэмми. Через форму прикрепил... В течении 10-12 минут пытался модели доказать, что в файле есть певица Леди Гага. Но похоже её действительно в файле нету xD.
Потом я решил спросить у ИИ сколько времени. На что он сказал в духе: "В файле этой информации нет.... И я то же не могу посмотреть время. Предлагаю самостоятельно посмотреть на часах ".
В общем задумался.... Хотя ИИ гугла спокойно отвечает на вопросы по файлу....
Вышла Qwen3-Coder-Next: модель с открытыми весами для кодинг-агентов