Comments 7
Claude нравился ещё со времён первых версий.
Забавно, что на практике, для моих проектов gpt 5.4 (high / xhigh) показывает себя на уровне Sonnet 4.6 +-, но лучше держит длительную итеративную работу. И будем откровенны - несколько сессий работы агента минут по 10-20 на плане за 20$ в Claude просто не возможны, в отличии от Codex (там лимиты Х2 сейчас).
Ну а на счёт 4.7 - жду появления в antigravity. Хотя с учётом того, что с января лимиты на Claude семейство там урезали в 30х (в 30 раз, Карл!) можно будет только поприветствовать его 🤷🏼
Так обычная 5.4 это как раз по уровню и бенчам друг и соратник Sonnet 4.6, но за токен сильно дешевле у OpenAI, это факт — так что даже без повышенных лимитов разница должна быть заметна.
Я планирую через пару недель перескочить с Max $200 на Max $100 на Клоде и взять ChatGPT Pro $100 — интересно попробовать pro модели у OpenAI, и x2 лимиты как раз до конца мая еще)
А откуда информация про лимиты до конца мая, если не секрет? Я думал что со дня на день прикроют лавочку.
Что касается бенчей - у Gemini 3.1 pro она примерно на том же уровне.
Безусловно, вероятно есть сценарии в которых эта нейронка показывает себя достойно.
Но субъективно - это либотомизированное нечто, не пригодное для целей серьезнее, чем написать рецепт жаренных пельменей. Единственная нейронка на которую я нет-нет,э да срываюсь браным словом.
Про "меньше валидации и больше возражений" — подтверждаю, в code review прямо чувствуется: 4.6 чаще соглашался и уходил реализовывать сомнительное решение, 4.7 останавливает и просит уточнить. Для агентных пайплайнов это плюс, но в клиентских чат-ботах пришлось переписывать часть system-промптов — модель стала чаще пушбекать на формулировках пользователя, где раньше мягко переформулировала. Ещё наблюдение: дефолт xhigh в Code заметно меняет экономику длинных сессий, имеет смысл явно опускать до medium на рутинных правках, иначе бюджет уходит быстрее, чем в 4.6.

Claude Opus 4.7: трейд-оффы, Extra High и новый характер