Comments 10
Gemini не конкурент?
а есть какая моделька, чтобы смогла как Opus, только локально?
Glm 5.1, возможно
По бенчам DeepSeek V4-Pro типа на уровне opus 4.6. Пару миллионов на железо, и будет гуд. Мак или сборки на картах 5090 - не то.
Даже если в чатике выдает +-20 токенов в секунду и на пообщаться хватит, агент будет на такой скорости работать неделями. Для мощных задач с потребительским железом проблема.
Автор почему-то пропустил auto approve режим в Claude, который сам решает, какие из действий агента безопасно разрешить автоматически, а где - нужно обязательно позвать оператора.
Но все равно исследование интересное. И более-менее сходится с моим опытом о моделях. Что архитектуру, структуру приложения или задачи лучше поработать с Opus. Реализацию же - последние версии GPT справляются прилично.
Начиная GPT 4o и ранних Sonnet, всегда очень быстро разочаровывался в GPT и продолжал работать с Claude вплоть до текущего момента. Но в последнее время все чаще и чаще мелькают положительные отклики (как будто даже не маркетинговые) на новые модели OpenAI. Следует дать ещё шанс?
Opus 4.7 vs GPT-5 vs DeepSeek V4-Pro: три агента строят TSS-CLI на Rust