Обновить

Комментарии 7

Несмотря на малое количество активных параметров и хорошее теоретическое соотношение качества и эффективности, цены на api Qwen3-Next выше намного чем этот же gpt-oss-120B в целом и общем, хоть и зависит от провайдера api. А по идее должно быть сопоставимо. Значит инференс модели ещё не оптимизирован.

Пока похоже не сильно отличается от обычной Qwen3-Next, по крайней мере основная проблема, с которой постоянно сталкиваюсь, такая же: при анализе кода находит синтаксические ошибки там, где их нет, и в качестве исправления предлагает ту же строку, в которой якобы и нашлась ошибка. На других моделях такое не наблюдал.
Типа такого:
Syntax Error in Function Signature (Line 53) Issue:

def init(self, config_path: str = None): - incorrect type hint and colon placement

Fix: Corrected to def init(self, config_path: str = None):

Syntax Error in File Opening (Line 65)
Issue:

with open(self.config_path, 'r', encoding='utf-8') as f: - missing opening parenthesis
Fix: Added missing parenthesis

Слова "анализ" и "проанализировать" и их английские аналоги являются слишком сильно обобщёнными. Лучше формулировки вида "проинспектируй код на уязвимости" или ещё более детализированный промпт. Малодетализованные вопросы лучше отдавать более крупным моделям

Все оказалось проще - это баг в llama.cpp, который вот только сейчас исправляют.

Да, действительно подобное поведение наблюдается. Проверял на qwen3-next-80b-a3b-instruct и С++ коде, но расширенный промпт может как минимум частично купировать проблему. Я использовал следующий промпт: "Проинспектируй код на ошибки и неточности; предложи исправления. Ошибка - это когда явно найдена неточность и ясно что фрагмент работает не так как нужно. Если фрагмент кода просто подозрительный, то это не ошибка, так как ты не сможешь чётко пояснить в чём заключается ошибка." Откровенный бред с одинаковыми строками (предположительно ошибочной и исправленной) пропал. Как временное решение до починки llama.cpp вполне сойдёт, так как остальные рассуждения модели вполне нормальные мне показались.

а что такое swы агент?

Не силён в языковых моделях. По приколу в lm studio скачал, запустил. Взял страницу с вики 18 премия грэмми. Через форму прикрепил... В течении 10-12 минут пытался модели доказать, что в файле есть певица Леди Гага. Но похоже её действительно в файле нету xD.

Потом я решил спросить у ИИ сколько времени. На что он сказал в духе: "В файле этой информации нет.... И я то же не могу посмотреть время. Предлагаю самостоятельно посмотреть на часах ".

В общем задумался.... Хотя ИИ гугла спокойно отвечает на вопросы по файлу....

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
otus.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
OTUS