Хз, у меня есть доступ к ультра и даже немного к закрытым версиям, но тестировать вообще не хочется, они в открытую заявляют что фокусируются на претрейне по сути, а без RL или ОЧЕНЬ качественного SFT на ОЧЕНЬ хороших агентных данных модель для кодинга бесполезна.
Дали попробовать всем на 2 недели, а дальше только жёсткая тарификация без субсидий за инференс через подписки.
Если внимательно читать первоисточник, то написано, что модель будет возвращаться в планы подписок по ходу возможностей компании. У anthropic сильно не хватает мощностей, и они приотезируют продажу по api таким образом.
Довольно смешной комментарий, вроде и совет неплохой, но вся аргументация мимо)
Claude Code, как и Codex, сильно выгоднее курсора. Это главный плюс, месячный лимит курсора тратиться за пару дней, кодекс на 20$ плане позволяет кодить где-то 3 часа в день спокойно, кодекс на 100$ плане позволяет делать современные сценарии использования агентов.
Что у CC, что у Codex есть а) плагин в vs code/cursor, b) отдельное приложение (у claude оно дико забагованное, но зато у кодекса оно прям топ). И да, в приложении можно в одном окне работать сразу в нескольких репо.
CLAUDE.md - антропики могут пойти в одно место за то, что не переходят на стандартный поддерживаемый везде AGENTS.md(хотя, учитывая как opus тупее gpt 5.5, может оно и к лучшему, ибо CLAUDE.md приходится держать сильно более многословным). Кстати, иерархия работает внутри проекта, никто не мешает класть AGENTS.md внутрь папок, они будут тоже читаться автоматически, скрин как выглядит настроенное репо:
да, они автоматом читаются когда агент начинает работать в папке
Параллельность - мимо, параллельные агенты появились в курсоре полгода назад, можно только сказать спасибо автору статьи что он плохо это описал. Поддержка worktrees из коробки при запуске параллельных агентов в курсоре появилась чуть ли не первой. А ещё есть облачные агенты.
CLI вместо GUI - опять же, спасибо автору статьи за супер актуальный обзор, Cursor CLI существует уже месяцев девять)) Кстати, `claude -p` порезали, и теперь оно тратит отдельный маленький пул кредитов для автоматизации, и не идёт в лимиты подписки, удачи с автоматизацией)))
AGENTS.md это сейчас стандарт в индустрии, и мне непонятно, какие ещё правила вам нужны, оно и так рекурсивно подгружается(т.е. агенты при попытке чтения файла из директории в репо рекурсивно автоматом получают все AGENTS.md которые есть в папках с этим файлом), а всё остальное можно прописать текстом, модели сейчас достаточно умные. В целом все, что нужно от правил, спокойно помещается либо в скиллы, либо в AGENTS.md раскиданные по репо, пушить ide-specific правила это так себе совет. И нет, AGENTS.md подходит не только под простые проекты я говорю как человек работающий в монорепо с 10+ микросервисами на разных языках, они говорят про "простые проекты" чтоб люди залочились под курсор и было сложнее перейти на альтернативы. Учитывая насколько выгоднее тот же кодекс, затачивать репо под курсор это странное решение.
Про новый интерфейс, тут явно видно что статья несколько застряла в 2025. Основной навык при работе с агентами сейчас это работа над несколькими фичами одновременно, для этого и нужен новый интерфейс, раз вы особо не говорите про него, то статья на 2026 не дотягивает. Одна строчка упоминания про worktrees это только подтверждает, в курсоре довольно прикольно можно запускать прототипирование с несколькими моделями, работать сразу в нескольких worktrees в одном интерфейсе, а вы вместо этого расписывает какие-то никому не нужные rules :)
Ну такое, поверхностно и немного устаревшая статья. Ни слова про их новый интерфейс, который они пушат как основной. Cursor rules довольно устарели и лучше пользоваться общепринятым agents.md. Скиллы курсор сейчас спокойно читает из .agents, и не надо больше софтлинки делать чтоб у других в команде работало кто пользуется кодексом/OC/Pi и так далее.
В статье не упоминается довольно забавный факт из бенчмарка где они сравнивали их harness и нативные для моделей, и, ожидаемо, Claude Code оказался сильно хуже чем mini-swe-agent.
Linear? Типо, мне сложно сказать, у нас в команде джира используется через жопу и я мало с ней работал (будем честны, весь скрам делается у нас в команде через жопу, вообще тупо в гитлабе всё делаем и """дейли""" по 30-60 минут это норма), но слышал много положительных отзывов о linear от тех кто пользуется.
Anthropic максимально активно отлавливает все использование подписки вне Claude code. А сейчас они даже отрубили возможность использовать лимиты подписки на "claude -p", на это отдельный мелкий пул выделили.
Вопрос про железо сложный ибо я как мудак запускаю всё прямо на нашем HPC, прям вне slurm:)
Тут главное ограничение это ресурсы вашего приложения, т.е. если вы хотите чтоб агент мог запускать код, то стенд должен быть достаточно мощный для этого (у меня не все пайплайны работают в режиме запуска кода, часть просто читают репо чтоб ответить в issue). Сам опенкод жрёт ну мегабайт 500, и то это если с TUI.
Ну и в целом зависит от активности команды, у нас всё тузло так что дай бог если один мир в день открывается, ну и в нём пингуется бот на ревью/тестирование периодически.
Ревьюить по диффам дело довольно бесполезное, я бы только gpt 5.4-5.5 доверил(нет не опусу, опус часто выдаёт дичь), и стоимость ревью выйдет довольно большой.
Если хочется нормального подхода, то делайте OpenCode review агента, давайте ему возможность запускать код, и вот это уже будет работать даже с небольшими моделями типо minimax m2.7. У нас для ревью пайплайн примерно как на скрине.
Где - платиру, но больше таких вкусных предложений не вижу, только за 3к на год. Кстати, в приложении chatGPT (а если вы "серьёзно" вайбкодите то подписка плюс/про должна быть) недавно добавили схожую функцию
Ну вам как человеку разницы нет, а вот модели есть в силу её архитектуры.
Модель начнёт пытаться писать ответ на русском. В зависимости от модели она начнёт делать и промежуточные выводы на русском, а может даже и reasoning. Поскольку модель хуже генерирует русский, то повышается ошибка галлюцинации - в первую очередь модели учат на английских данных. Если у модели внутренние рассуждения на англ, то вы получаете мешанину в attention постоянно, если на русском, то оно там вообще может сходить с ума внутри.
Кроме того, весь фронтир это MoE модели. У них знание распределены неоднородно, какие-то эксперты лучше работают с русским, какие-то хуже. Вы заставляете роутер экспертов выбирать первых, что снижает вероятность сработать релевантному для задачи эксперта.
Ну и как я уже сказал, эффективность токенизации. У меня зачастую задачи занимают по 100-200к контекста. Чем дальше идём в контекст, тем менее точно работает модель. Использование русского = раздувание контекстного окна -> падает точность.
Дело не только в токенизации, модели видели на порядок больше данных на английском, весь код это по сути английский, весь coding RL делается на английском(ну может ещё на китайском немного), большинство терминов это английский. Даже если забить на token efficiency, вы просто выходите модель из режима под который она обучалась, особенно когда речь идёт про кодинг.
Пользуюсь wispr flow уже несколько месяцев, проблем из поста не заметил, сильно упрощает жизнь. Правда мне мультиязычность не нужна - считаю что общаться с ллм на русском это моветон и дроп качества генерации. Ключ на год можно взять за что-то около 1.5к кстати.
Ну в целом Claude Code не самый лучший harness, может удобно если привык, но я больше месяца не выдержал когда попробовал после OpenCode. Да, и как бы то не было смешно, по метрикам тот же опус вне CC работает лучше :) Сам пользуюсь codex + OpenCode.
В целом советую присмотреться к OpenCode, Pi, Hermes, Droid. Сам пользуюсь OpenCode, с настроенными агентами, хуками на гитлаб и так далее, кайф. И туда можно легально добавить codex подписку, учитывая что gpt 5.4 сильно лучше опуса везде кроме фронта это очень хороший вариант. Много кто очень положительно говорит про три другие harness что я упомянул(особенно про связку GLM 5.1 + droid), пользоваться CC сейчас становится всё меньше и меньше смысла.
(по слухам) 5.2 это был сыроватый чекпоинт, 5.3 это полное обучение того же претрейна. Что интересно, ни слова про обычную 5.3 для чата, только codex вариант.
Хз, у меня есть доступ к ультра и даже немного к закрытым версиям, но тестировать вообще не хочется, они в открытую заявляют что фокусируются на претрейне по сути, а без RL или ОЧЕНЬ качественного SFT на ОЧЕНЬ хороших агентных данных модель для кодинга бесполезна.
Инференс не копейки, они сейчас снимают серваки вообще везде, где только можно, даже у xAI арендовали, и им всё равно еле хватает.
1) У Сбера есть репо где-то на гитхабе с проксёй которая переводит их странный api в нормальной openAI формат.
2) Модельки не проходят никакого адекватного RL, поэтому агентности от нах не ждите особо.
Если внимательно читать первоисточник, то написано, что модель будет возвращаться в планы подписок по ходу возможностей компании. У anthropic сильно не хватает мощностей, и они приотезируют продажу по api таким образом.
Доброе утро, уже не идёт, идёт в отдельный лимит programmatic usage, т.е. без субсидизации
Довольно смешной комментарий, вроде и совет неплохой, но вся аргументация мимо)
Claude Code, как и Codex, сильно выгоднее курсора. Это главный плюс, месячный лимит курсора тратиться за пару дней, кодекс на 20$ плане позволяет кодить где-то 3 часа в день спокойно, кодекс на 100$ плане позволяет делать современные сценарии использования агентов.
Что у CC, что у Codex есть а) плагин в vs code/cursor, b) отдельное приложение (у claude оно дико забагованное, но зато у кодекса оно прям топ). И да, в приложении можно в одном окне работать сразу в нескольких репо.
CLAUDE.md- антропики могут пойти в одно место за то, что не переходят на стандартный поддерживаемый вездеAGENTS.md(хотя, учитывая как opus тупее gpt 5.5, может оно и к лучшему, ибоCLAUDE.mdприходится держать сильно более многословным). Кстати, иерархия работает внутри проекта, никто не мешает кластьAGENTS.mdвнутрь папок, они будут тоже читаться автоматически, скрин как выглядит настроенное репо:Параллельность - мимо, параллельные агенты появились в курсоре полгода назад, можно только сказать спасибо автору статьи что он плохо это описал. Поддержка worktrees из коробки при запуске параллельных агентов в курсоре появилась чуть ли не первой. А ещё есть облачные агенты.
CLI вместо GUI - опять же, спасибо автору статьи за супер актуальный обзор, Cursor CLI существует уже месяцев девять)) Кстати, `claude -p` порезали, и теперь оно тратит отдельный маленький пул кредитов для автоматизации, и не идёт в лимиты подписки, удачи с автоматизацией)))
AGENTS.mdэто сейчас стандарт в индустрии, и мне непонятно, какие ещё правила вам нужны, оно и так рекурсивно подгружается(т.е. агенты при попытке чтения файла из директории в репо рекурсивно автоматом получают всеAGENTS.mdкоторые есть в папках с этим файлом), а всё остальное можно прописать текстом, модели сейчас достаточно умные. В целом все, что нужно от правил, спокойно помещается либо в скиллы, либо вAGENTS.mdраскиданные по репо, пушить ide-specific правила это так себе совет. И нет,AGENTS.mdподходит не только под простые проекты я говорю как человек работающий в монорепо с 10+ микросервисами на разных языках, они говорят про "простые проекты" чтоб люди залочились под курсор и было сложнее перейти на альтернативы. Учитывая насколько выгоднее тот же кодекс, затачивать репо под курсор это странное решение.Про новый интерфейс, тут явно видно что статья несколько застряла в 2025. Основной навык при работе с агентами сейчас это работа над несколькими фичами одновременно, для этого и нужен новый интерфейс, раз вы особо не говорите про него, то статья на 2026 не дотягивает. Одна строчка упоминания про worktrees это только подтверждает, в курсоре довольно прикольно можно запускать прототипирование с несколькими моделями, работать сразу в нескольких worktrees в одном интерфейсе, а вы вместо этого расписывает какие-то никому не нужные rules :)
Ну такое, поверхностно и немного устаревшая статья. Ни слова про их новый интерфейс, который они пушат как основной. Cursor rules довольно устарели и лучше пользоваться общепринятым agents.md. Скиллы курсор сейчас спокойно читает из .agents, и не надо больше софтлинки делать чтоб у других в команде работало кто пользуется кодексом/OC/Pi и так далее.
В статье не упоминается довольно забавный факт из бенчмарка где они сравнивали их harness и нативные для моделей, и, ожидаемо, Claude Code оказался сильно хуже чем mini-swe-agent.
Linear? Типо, мне сложно сказать, у нас в команде джира используется через жопу и я мало с ней работал (будем честны, весь скрам делается у нас в команде через жопу, вообще тупо в гитлабе всё делаем и """дейли""" по 30-60 минут это норма), но слышал много положительных отзывов о linear от тех кто пользуется.
Anthropic максимально активно отлавливает все использование подписки вне Claude code. А сейчас они даже отрубили возможность использовать лимиты подписки на "claude -p", на это отдельный мелкий пул выделили.
Вопрос про железо сложный ибо я как мудак запускаю всё прямо на нашем HPC, прям вне slurm:)
Тут главное ограничение это ресурсы вашего приложения, т.е. если вы хотите чтоб агент мог запускать код, то стенд должен быть достаточно мощный для этого (у меня не все пайплайны работают в режиме запуска кода, часть просто читают репо чтоб ответить в issue). Сам опенкод жрёт ну мегабайт 500, и то это если с TUI.
Ну и в целом зависит от активности команды, у нас всё тузло так что дай бог если один мир в день открывается, ну и в нём пингуется бот на ревью/тестирование периодически.
Сам собрал, мини приложение для обработки звуков от гитлаба и запуска опенкоде по ним. Могу скинуть ссыль на гитхаб, но там вайбкод на вайбкоде)
Ревьюить по диффам дело довольно бесполезное, я бы только gpt 5.4-5.5 доверил(нет не опусу, опус часто выдаёт дичь), и стоимость ревью выйдет довольно большой.
Если хочется нормального подхода, то делайте OpenCode review агента, давайте ему возможность запускать код, и вот это уже будет работать даже с небольшими моделями типо minimax m2.7. У нас для ревью пайплайн примерно как на скрине.
Где - платиру, но больше таких вкусных предложений не вижу, только за 3к на год. Кстати, в приложении chatGPT (а если вы "серьёзно" вайбкодите то подписка плюс/про должна быть) недавно добавили схожую функцию
Ну вам как человеку разницы нет, а вот модели есть в силу её архитектуры.
Модель начнёт пытаться писать ответ на русском. В зависимости от модели она начнёт делать и промежуточные выводы на русском, а может даже и reasoning. Поскольку модель хуже генерирует русский, то повышается ошибка галлюцинации - в первую очередь модели учат на английских данных. Если у модели внутренние рассуждения на англ, то вы получаете мешанину в attention постоянно, если на русском, то оно там вообще может сходить с ума внутри.
Кроме того, весь фронтир это MoE модели. У них знание распределены неоднородно, какие-то эксперты лучше работают с русским, какие-то хуже. Вы заставляете роутер экспертов выбирать первых, что снижает вероятность сработать релевантному для задачи эксперта.
Ну и как я уже сказал, эффективность токенизации. У меня зачастую задачи занимают по 100-200к контекста. Чем дальше идём в контекст, тем менее точно работает модель. Использование русского = раздувание контекстного окна -> падает точность.
Дело не только в токенизации, модели видели на порядок больше данных на английском, весь код это по сути английский, весь coding RL делается на английском(ну может ещё на китайском немного), большинство терминов это английский. Даже если забить на token efficiency, вы просто выходите модель из режима под который она обучалась, особенно когда речь идёт про кодинг.
Пользуюсь wispr flow уже несколько месяцев, проблем из поста не заметил, сильно упрощает жизнь. Правда мне мультиязычность не нужна - считаю что общаться с ллм на русском это моветон и дроп качества генерации. Ключ на год можно взять за что-то около 1.5к кстати.
Ну в целом Claude Code не самый лучший harness, может удобно если привык, но я больше месяца не выдержал когда попробовал после OpenCode. Да, и как бы то не было смешно, по метрикам тот же опус вне CC работает лучше :) Сам пользуюсь codex + OpenCode.
В целом советую присмотреться к OpenCode, Pi, Hermes, Droid. Сам пользуюсь OpenCode, с настроенными агентами, хуками на гитлаб и так далее, кайф. И туда можно легально добавить codex подписку, учитывая что gpt 5.4 сильно лучше опуса везде кроме фронта это очень хороший вариант. Много кто очень положительно говорит про три другие harness что я упомянул(особенно про связку GLM 5.1 + droid), пользоваться CC сейчас становится всё меньше и меньше смысла.
(по слухам) 5.2 это был сыроватый чекпоинт, 5.3 это полное обучение того же претрейна. Что интересно, ни слова про обычную 5.3 для чата, только codex вариант.