Z.ai выпустили GLM-5.1 — open-source модель, заточенную под долгие агентные задачи

Z.ai выпустили GLM-5.1 — новую флагманскую модель под MIT-лицензией, ориентированную на агентные инженерные задачи. По SWE-Bench Pro она набирает 58.4% против 57.3% у Claude Opus 4.6 и 57.7% у GPT-5.4. На NL2Repo (генерация репозиториев) GLM-5.1 обходит GLM-5 с 35.9% до 42.7%.
Но интереснее другое. Большинство моделей ведут себя одинаково: быстро берут низко висящие плоды, потом останавливаются. Дополнительное время не помогает — стратегия исчерпана. GLM-5.1 проектировали с прицелом на другое поведение.

















