Pull to refresh

Comments 101

Использую opus и уже больше года. Прогресс огромный.

а почему именно Opus, а не Sonnet?

Потому что Opus умнее Sonnet

— Чем, чем умнее?
— Чем Sonnet!

(почти ©)

Умом умнее. То есть думает лучше.

Умом умнее

...которого у генератора следующего наиболее вероятного токена нет чисто по определению.

думает лучше.

И часто Вы она антропоморфизируете?

А вы можно подумать не следующую букву не клавиатуре жмете когда текст пишите? Может задом наперед? Или может вы научились думать как GPU - разбить мысль на 1000 потоков паралельно их продумать и оба - выдать ответ?

Разница между вами и текущими LLM в том что в вашей нейросетке около 100 триллионов синапсов, а у текущих LLM порядка 1 триллиона весов.

Разница между ним (или мной, или вами) и LLM в любом из аспектов, который мы можем выделить. Это принципиально различные системы, и их сравнение между собой никакого практического смысла не несёт.

То что вы можете выделить в их функционирование нечто общее (создание текста), не означает, что в этом и состоит их суть. И даже в вашем сравнении вы упрощаете до крайности. Если в llm за распространение активации отвечают веса, то в случае с мозгом это комплексный процесс, в котором задействованы и синапсы, и нейроны, и химический фон среды, и всё это не просто несколько чисел, а сложные молекулярные структуры.

Ясное дело что реализация одной и той же модели в кремнии будет отличается от реализации в биологии, но принцип похожий.

Веса нейронок в LLM это аналогия синапсов. И те и другие пропускают сигнал или его часть в зависимости от параметров - весов в llm или бихоимии в нейронах / синапсах.

Есть даже исследования которые определили что биологические нейронки хранят примерно 4.7 бит на синапс (имеют 26 различимых уровней силы синапсов).

И в целом архитектура современных LLM (RNN / transformer) основаны на набюдениях за биологическими аналогами (рекуррентные связи, нейромодуляторы внимания, и тд).

Поэтому я не согласен с утверждением что LLM это просто предсказатели токенов, а люди - это принципиально другое. Чтобы так увтерждать надо хотя бы построить модель сопоставимых размеров, и тогда уже и делать выводы.

Я понимаю и принимаю ваши аргументы. Они валидны и справедливы на своём уровне абстракции. Я лишь хочу указать, что любая аналогия строиться на абстрагирование, а любое абстрагирование на упрощение.

Мы можем найти в LLM и мозге человека крайнюю схожесть. И эта схожесть строиться на том, какие детали мы систем значимыми, а какие отбросим. Вы указываете, что были исследования установившие "вес" синапса в битах, возможно так и есть, я не знаком с ними, но как я указывал до, синапсы лишь один из множества факторов модуляции сигнала. То что математические модели, на которых построены LLM, вдохновлены мозгом не означает, что они тождественны.

Чтобы сделать выводы о "принципиально другом", ни к чему создавать LLM на 100 триллионов параметров. Достаточно указать на то, что это вопрос рассмотрения систем, то есть субъективности восприятия. Принципиально схожие процессы мы можем найти и в работе LLM, и в работе мозга, и в функционировании цивилизации, и в экономических процессах. Означает ли это их принципиальное сходство? Но ведь мы можем найти и множество различий. Означает ли это их принципиальное различие? Всё это зависит исключительно от того, какие свойства вы посчитаете значимыми, а какими решите принебречь.

Разница между вами и текущими LLM в том что

...я вообще образами думаю — а в слова их приводится переводить для презренных человечишков, которые иначе не понимают.

Примерно так

Люди любят все очеловечивать. Солнышко греет, гроза сердится, машина не хочет заводиться теперь и компьютер думает. Антропоморфное мышление.

Так никого нет близко, кто бы мог с людьми конкурировать

Нет, разница между мозгом и LLM в том, что у мозга есть абстрактное мышление. Мы не выдаем слово за словом согласно внутренней статистике, наш мозг сначала "визуализирует" ответ, а затем воспроизводит его в виде слов, а может и в виде жестов итп. Вот как LLM наш мозг мыслит, когда мы переводим с одного языка на другой, при этом переводим на в тот язык, который мы не знаем на уровне носителя. Вот в таком случае мы действительно анализируем поток слов, который мы бы на родном языке выдали и подбираем наиболее подходящие на наш взгляд слова из другого языка. Но сам процесс мышления выстроен иначе. Точнее он у нас просто есть в отличии от LLM

Я-то, если что, шутку продолжил, а не очеловечивал алгоритм.

Но получилось интереснее, чем предполагал.

Потому что Opus умнее Sonnet

А вот что говорят другие, по отзывам в интернете. Что называется, есть нюансы.

На реальных задачах разрыв между актуальными Opus и Sonnet небольшой: оба решают большую долю задач.

В предыдущих версиях, Sonnet 3.5, например, лучше справлялся с типичными задачами кодинга, а Opus брал глубиной рассуждений. Сейчас линейки сблизились.

Opus дороже за токен, что очень даже заметно. Его выгодно использовать - финтех, критичные бекенды, сложная оптимизация, редкий, но тяжёлый ресёрч‑рефакторинг.

Sonnet оптимален как «рабочая лошадка» для повседневной разработки.

Вот еще один отзыв из интернета.

Ежедневно использую Claude для реальных коммерческих задач. Enterprise-бекенд, от десятков до сотен тысяч строк кода в контексте, в зависимости от сервиса. Opus 4.5 - основная модель для работы.

Использую Augment, и, поскольку его UI тоже навайбкодили, он иногда забывает предпочитаемую версию модели и ставит дефолтную, и сейчас это Sonnet 4.5. Я не всегда это замечаю глазами в интерфейсе, но каждый раз вижу это в производимом коде, причем, как правило, после первой же выдачи. Может быть, кому-то не очень заметно, насколько Опус умнее Соннета, если постоянно использовать второй. Но вот то, насколько Соннет тупее Опуса в обратной ситуации - это просто невозможно игнорировать. Там пропасть такая, что по факту использовать Опус почти всегда выгоднее - он просто быстрее и правильнее делает как надо, за меньшее число проходов и уточнений.

ну так это как раз и подтверждает сказанное выше на примере - "Enterprise-бекенд, от десятков до сотен тысяч строк кода в контексте"

Его (Opus) выгодно использовать - финтех, критичные бекенды, сложная оптимизация, редкий, но тяжёлый ресёрч‑рефакторинг.

А если в проекте нет такой сложности, то стоит ли платить больше? Я вот уже несколько дней подряд на Опусе очень быстро упираюсь в лимит, буквально в рамках одного не самого большого чата. Но в целом, моя исходная постановка вопроса была не совсем правильной. Не какую модель выбрать, а можно использовать разные (из этих двух) под разные задачи. Другое дело, что не всегда заранее можно понять, будет ли задача простой или сложной. Иногда вроде мелочь, а растягивается на пару дней.

На идентичных задачах Опус решает проблему намного быстрее Соннета. Из моего личного наблюдения, разница в разы. Грубо говоря, мне надо два-три часа на то, что с Соннетом занимало больше дня. С Опусом 4.6 разрыв еще больше. Хоть у Опуса и дороже токены, эффективность их использования на совершенно ином уровне.

Иногда сонет лучше, особенно для задач со средним уровнем сложности. Да и расход токенов меньше.

Opus - это reasoning модель - она медлительнее, но зато меньше ошибается и меньше галюцинирует

На лицо

а я то думаю от куда запах

лимиты? Раньше auto было без ограничений, сейчас стоит лимит. Всадил лимиты, теперь куковать 17 дней без курсора при подписке Pro

С этим лимитом Claude code становится хорошей альтернативой. Странно, что нигде не вижу новостей о изменениях в тарифах

Насчёт лимитов ещё не успел проверить Claude Code. Но вот несколько дней назад работал ещё с чатом Claude и там пару раз нарывался на расходование дневного лимита. Раньше такого как-то не было, никаких сообщений не появлялось.

Подтверждаю, лимиты тоже стали более жесткими в claude, буквально 1-2 недели назад появилось

Если самый модный опус с самым высоким thinking и большим контекстом, то расход в три раза выше. Плюс если подключены с десяток mcp, скиллы, сабагенты и др.

Вообще не заметил разницы в лимитах за последнее время. На Max x5 5-часового лимита хватало впритык просто при кодинге что 2 месяца назад, что сейчас. Если более творческая задача и обработка текста, то уже не хватает лимитов.

Есть вариант потокенной оплаты.
Вообще, зачем этот примитивный интерфейс, когда агент, встроенный в IDE гораздо удобнее и продуктивнее? Я имею ввиду не Cursor, а агенты в VS Code.

Прелесть claude code в достаточной открытой архитектуре, по сравнению с остальными. Это классный конструктор. У него есть интеграции с разными IDE, включая VSCode, в том числе и в режиме агента.

Это я и имею ввиду - использую claude в vs code. Я о том, что само десктопное приложение от claude - какое то примитивное, по сравнению с IDE.

Может это конкретно с android studio или jetbrain-овскими ide такая беда, но все расширения встраивающиеся туда как будто написаны тем самым llm без участия человека - бесконечные баги, утечки памяти, не очень удобный интерфейс и свойства периодически класть студию. У оценки у них всех около 3/5

У меня CLine, таких багов не наблюдаю. Студия бывало вылетала, но редко.

Есть вариант потокенной оплаты.

Выходит дороже. :)

агент, встроенный в IDE гораздо удобнее и продуктивнее?

Code тоже неплохо интегрирован в VSCode, но кроме того ещё и неплохо интегрирован с чем угодно. А с чем ещё не интегрирован -- можно интегрировать.

Я пока ни разу в лимиты не упирался (но, судя по комментариям, скоро упрусь). Как сильно замедляются запросы, когда выходишь за лимиты?
В целом у меня есть вопросы которые можно и моделям попроще кормить, а есть которые хочется получить максимальное качество, видимо теперь придётся думать у кого спрашивать.

Они не замедляются. Они отклоняются.

Да? Раньше же просто сильно замедлялись. Плохо...

Как сильно замедляются запросы, когда выходишь за лимиты?

Они вроде как не замедляются, просто к месячной подписке добавляется ещё и дополнительная оплата, теперь уже конкретно по количеству токенов

В целом у меня есть вопросы которые можно и моделям попроще кормить, а есть которые хочется получить максимальное качество, видимо теперь придётся думать у кого спрашивать. 

Именно так и получается, что не сильно хочется палить из дорогой пушки (Опус) по воробьям, если можно на простых задачах обойтись Сонетом.

Claude крутой для кода, но лимиты менее жесткие в Codex от GPT

это временно, codex до середины марта с дабл лимитами

ах вот оно что михалыч

Курсор сам может с собой попрощаться. Сейчас нет возможности для разработчиков софта тормозить с развитием продуктов в сфере ии. Во множестве плагинов для vs code есть аркестратор. Разница с ним и без него такая же как с копированием кода вручную и тем, что сейчас есть в курсоре.

Поясните свою мысль. Я только вкатываюсь в тему вайба, Claude Code / Opus , основной средой последние годы был VSC и что за хайп вокруг Курсора - разбираться было лень. Работает и так всё. Что дополнительно на эту связку можно навесить для левел ап?

Я пощупал Cursor. В итоге установил в VSC расширение Codex. Пишет как с нуля, так и правки делает.

Находили расширение, которое делает автокомплит через Ии и только его, или по крайней мере не конфликтует с другими? Раньше я использовал Continue — но он засыпал все меню неубираемыми элементами и был за это послан в баню.

Вкладка code и cowork были уже давно на МАХ подписке. Для более автономного создания MVP я всё же использую replit как мультиагентную систему которая не просто создает код, а еще и тестирует его сама через LAM модель прокликивая всё в интерфейсе. Claude code хорош потом для локальных небольших доработок.

Вкладка code и cowork были уже давно на МАХ подписке

Ну так это же на MAX! ))

У меня бот сидит и всегда будет сидеть в отдельном чате отвечая на четко поставленные вопросы. Никакого доступа к коду и никакой интеграции с IDE.

это не про вайбкодинг) Как читать газету по старинке

Это вам нужно просто посмотреть как другие это дело настраивают и работают.

Не то, чтобы про интеграции в ide, а вообще как оно бывает.

Можно пешком идти, для удовольствия, можно на велике, а можно и на ф1

Я уже давно и одним из первых на все посмотрел. Две главные причины, почему:

1. Я отвечаю за написанное мной. Чтобы отвечать я должен полностью понимать как все работает. Для каждой строчки кода я должен знать причину, почему она такая, а не другая. Без знания и понимания невозможно принимать правильные решения по изменению и развитию проекта. Настоящий разработчик знает, что исходный код - это только часть, вторая часть у него в голове, и обе из них одинаково важны.

2. Чем больше полагаешься на AI бота, тем сильнее деградируешь сам, что приводит к профессиональной некомпетентности.

А чем мешает условный курсор понимать как все работает? Вы говорите про 2 части реализации - в голове, и сам код. У меня использование сводится к тому, что я знаю в голове какая архитектура мне нужна и как она будет выглядеть в виде кода, те я могу написать ее руками. Дальше просто эту задачу объясняю ии и он пишет быстрее в несколько раз. Далее просмотр изменений и прием/отмена. Он же не меняет ничего без вашего ведома - все изменения видны и их можно принять/поправить/убрать. Тут речь не про то что он вас заменяет, а про то что помогает ускорить рутину. Грубо говоря как будто вам крепкого джуна рядом посадили и можно простые задачи ему спихивать, а самому более сложные решать или архитектуру продумывать.

На чтение кода всё же советую дать доступ. Будет более точно генерить нужный вам код.

начните с того, что cursor доступен в наших широтах, а claude - наверное единственная нейросеть, создатели которой не просто запрещают пользоваться людям из определенных стран, а еще и банят платные аккаунты с подписками, купленными за фулпрайс.

Как решили вопрос? Просто совсем уж негуманные цены у курсора стали.

И я не пойму, есть ли выгода от дорогих акков? Слухи ходят, что всё по цене апи идёт.

никак не решал. Пользовался и продолжаю пользоваться cursor. Если под конец месяца кредитов не хватает, то отменяю подписку и снова оформляю (на другой аккаунт)

Claude Code прекрасно работает через residential proxy США, просто exe-шник через Proxifier прокидываете и все ок. Но это конкретно терминальный Code (и обертка для него в vscode).

Proxifier - это виндовая утилита?

На MacOS вроде тоже есть.

Да у него просто в конфиге прокси есть. Не надо ничего выдумывать.

Тут скорее с оплатой сложнее и в целом с отношением к РФ

У меня Клод стабильно работает, а вот чатГПТ забанил мне оплаченный аккаунт

В наших широтах давно уже без КВН нормально пользоваться интернетом не получается. Я думал он по умолчанию предполагается.

Интересно есть ли экспериментаторы которые используют sonnet/codex в качестве координатора/планера а для получившихся задач китайские нейронки(kimi/glm/minimax)? Какой получается результат?

все эти нейронки так быстро обновляются что не успеваешь тестировать, да и планирование не такое уж и сложное, GLM 5 легко и сам справится с планом, не понятно зачем вам sonnet сверху.

Работаю через корпоративное облако, там без танцев с бубном работают только Cursor и Antigravity.

С вайбкодом люди делятся на 2 категории. Те у кого низкие требования или скилл - их больше всего и для них ИИ прямо божественное открытие, "генерят стартап за 10 минут", "пишет код лучше меня" итд. И те у кого высокие требования к коду/архитектуре - им приходится тратить много времени на исправления. Да - быстрее, но появилось раздражение от ии тупости там где раньше его не было..

Джуниор тоже может что попало накодить, если правильно задачу не ставить и не проверять.

А без джуниора много времени сеньора будет тратится на простые задачи, которые мог бы сделать джуниор. А сложные джуниор за него не сделает.

А если джуниор умеет не только сам по себе кодить, но ещё и ИИ умеет правильно использовать, то он потенциально смог бы задачи сеньора быстрее решать.

Эти вторые видимо не пробовали opus 4.5-4.6

Эти модели пока доступны только избранным, которые умеют генерировать стартап за 10 минут.

Нет, они вроде всем доступны

С января в помойку cursor отправил, даже на 3 дня не хватает, сейчас или api deepseek или Qwen в visual code, уже несколько дней бесплатно работаю с ним.

Как qwen по сравнению с агентами в cursor?

Мои мысли такие, именно в курсор реализация очень добротная, например если использовать чат gpt codex какой нибудь в cursor и в visual studio разница есть, это только мои ощущения, а по qwen, в целом сойдет плагин конечно не удобный, очень страдает в нем контроль процесса, но так как бесплатно и для моих небольших задач справляется не хуже gpt5 codex, по подписке пока лимиты жду qwen пользуюсь

Квен отлично справляется с большинством задач. Если хотите сравнения конкретных моделей, то у квен на сайте это сравнение есть.
Сравнивать "агентов в cursor" с qwen некорректно, это как теплое и мягкое сранивать.

Агенты есть и в курсоре, и в квен, можно одних и тех же использовать. Но вы наверное другое подразумевали под агентами?

Модели в Cursor выглядят подломанными - они как будто запромчены делать массу лишнего, потребляя в процессе уйму токенов.

Я бесплатный лимит Qwen уже исчерпал. Чему был удивлён, потому что даже при целенаправленном поиске информации об этом нашёл её не сразу.

Теперь через российский прокси на openrouter плачу и пользуюсь.

Я не понял из статьи, а почему "прощай, cursor" то?

Now only for the rich

Хз, с текущим курсом не так и дорого вроде, вот когда по 120 будет, тогда задумаемся. С другой стороны если инструмент приносит деньги, то чего бы за него не платить.

Не дорого? ну смотри 29 числа декабря я оплатил подписку 20$, 2 или 3 января уперся в лимит, далее взял другой аккаунт и врубил там опцию, 500 баксов за 8 дней, я считаю это оверпрайс, если тот же deepseek от 1 до 2 баксов в день уходит.

Курсор жрёт токены как не в себя, а статистика у них абсолютно не прозрачна. Плюс вечно что-то недоделано или отваливается. Мне кажется, что с таким подходом к делу они скоро распугают всех своих клиентов.

Ну в принципе это уже идет, а будет лавинообразно когда клиенты пощупают другие инструменты, не каждый вернутся. Судя по реддит оно уже так и происходит.

Ого, я столько не трачу, я и 20$ за месяц не вырабатываю. Я код много руками пишу.

Ну и еще я стараюсь не перегружать контекст и жестко ограничиваю правилами курсор.

Наверное, по соотношению цена/качество по сравнению с альтернативами?

Я не понял из статьи, а почему "прощай, cursor" то?

Ну вот, смотрите: есть две платные подписки - Cursor и Claude. У Cursor главная фишка - модели работают непосредственно с кодом проекта без копипаста. Теперь такая же фишка появилась у Claude и получается, что можно обойтись одним Claude без Cursor.

А он просто больше не нужен. Правда, он уже больше года не нужен.

Так-то Claude Code давно можно добавить в Cursor, VS Code как расширение и получить все эти функции.

Сам Claude Code существует достаточно давно как отдельное приложение

Claude Code давно можно добавить в Cursor

Там и добавлять не надо, поскольку он там уже есть. Так вот речь и о том, что теперь Claude Code сам по себе без Cursor встраивается в проект и работает не только в режиме CLI

Только это не "теперь", это "давно"

"давно" было в MAX, а теперь это и в Pro.

Подсказываю: Claude доступен в подписке Github Copilot. Получается значительно выгоднее, чем покупать подписку от самого Claude и меньше вероятность, что вас забанят.

Мне вот интересно, людям действительно так пофиг на качество того что они там на вайбкодили? а так же пофиг на свою безопасность?

Да, Claude модели топовые по качеству что они выдают, но Курсор тоже может использовать модели Антропик, как и Гугла и ОпенАИ...

тут вся разница в том что с курсором вы открываете проект в IDE, а с Клауде Код вы просто в терминале посылаете ИИ что-то сделать в проекте. да он вам выкатит diff чего поменял, но это все равно не удобно, это все равно не работа в IDE.

Про безопасность что я упомянул: я без DevContainers вообще больше не работаю. ранить ИИ в материнской системе где ИИ может сделать абсолютно все, ну так себе... Да Клауде тоже можно обернуть в девконтэйнер, но я на иконку курсора нажал, тот открыл проект сразу в контейнере, мне не надо его ручками из терминала запускать.

Ну короче кодить из терминала даже не открывая IDE это мне кажется какой-то пофигизм к качеству чего вы делаете. ИИ на говнокодил, работает и норм, пуш...

В общем со статьей не согласен, особенно учитывая что Курсор тоже может в Антропик модели по желанию.

кодить из терминала даже не открывая IDE это мне кажется какой-то пофигизм

с Клауде Код вы просто в терминале посылаете ИИ что-то сделать в проекте. да он вам выкатит diff чего поменял, но это все равно не удобно, это все равно не работа в IDE

Рукалицо. IDE видит все изменённые Клодом файлы. Или у вас IDE из прошлого столетия?

По наблюдениям у Cursor самый злые лимиты, при этом на тех же моделях cloude code c плагином для VsCode потребляет гораздо меньше за теже деньги.

Использую курсор в коммерческой разработке (несколько крупных ПК/консольных игр на UE5) уже довольно длительное время. Для вайбкода использую только если какой то одноразовый скрипт на питоне/коммандлет на плюсах написать надо, что бы 1 раз прогнать и выкинуть. В остальном код почти неподдерживаемый получается. Плюс за другими коллегами приходилось вычищать это.

Основной кейс использования - локализовать что то в базе движка/проекта, найти проблему почему такое поведение, найти лучшую точку для встраивания и всякое такое.
И тут Опус справляется в разы лучше, чем Cонет. Сонет часто бывало просто ходит по кругу и не может найти проблему. Про GPT вообще молчу, в последних версиях он больше с тобой спорит что по другому никак нельзя, чем реально ищет проблему. В некоторых задачах Опус находил проблему за пару запросов, которую сонет не мог день найти. И такой же фидбек от других коллег, кто его юзает.

Что касается самого курсора, то лично сам не сравнивал его с копайлотом и другими средами, но ребята кто щупал утверждали что копайлот просто не вывозит на столько что даже отказались от него. И курсор на уровне агента просто свою работу делает в разы лучше. Так что тут не только модельку надо сравнивать.

Все просто!

Opus — для бояр, а Sonnet — для работяг.

Курсор так то давно помер давно сли честно

Курсор чрезмерно дорогой и подойдет как игрушка для постепенного перехода от написания кода руками. Тот же windsurf куда приятнее и с еще бесплатным swe 1.5 будет лучше для начала.
Уже потом можно переходить на относительно бесплатный qwen-code, antigravity. И когда прокачаетесь - на claude code.
Имхо, и венец эволюции - lazy vim с плагинами, где можно по acp общаться c qwen-code и другими агентными штуками или просто рядом отображать.

Sign up to leave a comment.

Articles