Comments 4
Пока писали статью, gpt 5.5 уже решила полностью одну задачу))) мир меняется быстро https://programbench.com/blog/gpt-5-5-first-solve/
Жаль, что статья вся написана нейросетью.
Ну невозможно читать эти нейросетевые потуги. Так люди не пишут. Вот как вообще рука поднимается это публиковать? Это неуважение к себе или ко всем вокруг? И почему “сложный”? В статье ни одной строки кода и в принципе ни одной концепции для осознания не содержится. Автор, если вам сложно читать нейробред, зачем вы нас им кормите? И что вы тут обучили или напрограммировали? Куда администрация Хабра смотрит?
Интересно, как быстро китайцы натаскают свои модели на этот бенч, чтобы иметь маркетинговое преимущество.
Sign up to leave a comment.
Новый бенчмарк по кодингу для LLM ProgramBench: 9 топ моделей, 200 задач, 248 тысяч тестов. Полностью решённых — ноль