Pull to refresh

Comments 10

даже близко нет. юзаю с корп подпиской - не для серьезного кодинга она, ну никак. только как ревью плана и результата использовать можно, иногда подсвечивает неочевидные вещи

а есть какая моделька, чтобы смогла как Opus, только локально?

Glm 5.1, возможно

Если кластер 8 промышленных видеокарт мы считаем за "локально", то да. Но я дома такого ни у кого из приятелей не видел :)

По бенчам DeepSeek V4-Pro типа на уровне opus 4.6. Пару миллионов на железо, и будет гуд. Мак или сборки на картах 5090 - не то.

Даже если в чатике выдает +-20 токенов в секунду и на пообщаться хватит, агент будет на такой скорости работать неделями. Для мощных задач с потребительским железом проблема.

Автор почему-то пропустил auto approve режим в Claude, который сам решает, какие из действий агента безопасно разрешить автоматически, а где - нужно обязательно позвать оператора.

Но все равно исследование интересное. И более-менее сходится с моим опытом о моделях. Что архитектуру, структуру приложения или задачи лучше поработать с Opus. Реализацию же - последние версии GPT справляются прилично.

Это и был auto-approve. Без него, думаю, было бы ещё больше.

Вот это интересно. Но объяснимо. Авто-аппрув делает модель Sonnet, и видимо, ей тематика разработки неизвестна от слова "совсем", и она не может принять решения с нужной степенью уверенности.
Любопытный эксперимент :)

Начиная GPT 4o и ранних Sonnet, всегда очень быстро разочаровывался в GPT и продолжал работать с Claude вплоть до текущего момента. Но в последнее время все чаще и чаще мелькают положительные отклики (как будто даже не маркетинговые) на новые модели OpenAI. Следует дать ещё шанс?

Sign up to leave a comment.

Articles