egorsokolov Apr 16 at 18:43

Claude Opus 4.7: трейд-оффы, Extra High и новый характер

Medium

8 min

16K

Artificial IntelligenceMachine learning * Natural Language Processing * Lifehacks for geeksSoftware

Review

Comments 7

UFO landed and left these words here

Evgenii-Lopatin Apr 18 at 07:12

Claude нравился ещё со времён первых версий.

Забавно, что на практике, для моих проектов gpt 5.4 (high / xhigh) показывает себя на уровне Sonnet 4.6 +-, но лучше держит длительную итеративную работу. И будем откровенны - несколько сессий работы агента минут по 10-20 на плане за 20$ в Claude просто не возможны, в отличии от Codex (там лимиты Х2 сейчас).

Ну а на счёт 4.7 - жду появления в antigravity. Хотя с учётом того, что с января лимиты на Claude семейство там урезали в 30х (в 30 раз, Карл!) можно будет только поприветствовать его 🤷🏼

egorsokolov Apr 18 at 07:27

Так обычная 5.4 это как раз по уровню и бенчам друг и соратник Sonnet 4.6, но за токен сильно дешевле у OpenAI, это факт — так что даже без повышенных лимитов разница должна быть заметна.

Я планирую через пару недель перескочить с Max $200 на Max $100 на Клоде и взять ChatGPT Pro $100 — интересно попробовать pro модели у OpenAI, и x2 лимиты как раз до конца мая еще)

Evgenii-Lopatin Apr 18 at 07:41

А откуда информация про лимиты до конца мая, если не секрет? Я думал что со дня на день прикроют лавочку.

Что касается бенчей - у Gemini 3.1 pro она примерно на том же уровне.

Безусловно, вероятно есть сценарии в которых эта нейронка показывает себя достойно.

Но субъективно - это либотомизированное нечто, не пригодное для целей серьезнее, чем написать рецепт жаренных пельменей. Единственная нейронка на которую я нет-нет,э да срываюсь браным словом.

egorsokolov Apr 18 at 08:19

такое было с анонсом этого тарифа, а про Plus надо почитать, по-моему они говорили что как раз у плюсов заканчивается, а у pro начинается

viktdo Apr 19 at 06:08

Про "меньше валидации и больше возражений" — подтверждаю, в code review прямо чувствуется: 4.6 чаще соглашался и уходил реализовывать сомнительное решение, 4.7 останавливает и просит уточнить. Для агентных пайплайнов это плюс, но в клиентских чат-ботах пришлось переписывать часть system-промптов — модель стала чаще пушбекать на формулировках пользователя, где раньше мягко переформулировала. Ещё наблюдение: дефолт xhigh в Code заметно меняет экономику длинных сессий, имеет смысл явно опускать до medium на рутинных правках, иначе бюджет уходит быстрее, чем в 4.6.

egorsokolov Apr 19 at 06:11

да, я тоже заметил разницу, но честно говоря его pushback меня уже успел утомить местами, особенно в обычных беседах и рассуждениях, бывает избыточно — хотя я думал, что этого модели не хватает. Видимо, не все так просто. Буду наблюдать, или они подтюнят, или я)