runaway_llm12 апр в 11:39

Почему Claude Code «отупел» после февраля? Отчёт на 6852 сессиях

2 мин

14K

Искусственный интеллектМашинное обучение *

+16

Комментарии 35

Vytian 12 апр в 11:44

Инфляция К(л)ода

Triton5 12 апр в 12:07

Просто Антропиков жадность обуяла.

Triton5 12 апр в 13:42

А за что минус-то? Ведь реально обман клиентов.

Chillingwilli 13 апр в 13:22

Не жадность, а юнит-экономика, бесконечно субсидировать вайб-кодинг они не могут

НЛО прилетело и опубликовало эту надпись здесь

andrg13 12 апр в 12:20

Гемини, основной акк, из рф, на телефоне стоит, гео включено, постоянно отлетает впн. Работает и гемини, и антигравити. А последний так даже без впн работает, и опус в том числе.

GLM 5.1 попробуйте - весьма не дурно

zartdinov 12 апр в 14:53

GLM вроде подорожал сегодня, жалко

botyzanzylyvseNIKI 13 апр в 02:15

До Клода все ещё далеко

ITDiver77 13 апр в 08:40

Глм нравится. После дипсика прям хорошо. Даже 5ый сильно круче, по моим личным данным. М2. 5 тоже лучше дипсика, м2.7 наверно сравним с 5.0. 5.1 нравится наверное больше всех из них. Но. Вот прям сейчас она не работает. В Китае высокие часы, и просто ловит постоянно "сервер бизи" . И это минимальнейшая проблема. Основная - после 100к контекста может гнать бессвязный мусор. Вот прям вообще. Я такого треша нигде не видел. Они на лету крутят конфиги модели, и вот когда она заряжена, она работает круто. А когда они ужали её - ну такое. Самое фиговое, что ты не знаешь как она сейчас работает. Опять же, цена. За новую цену не вижу смысла. За прошлую взял про(лайт улетает слишком быстро у меня, про почти хватает) . Но надо иметь ввиду, что до 6 фев народ тарил за копейки, с меньшими ограничениями лимитов, и эта цена будет у них и при продлении. Соответственно куча нагрузки от дешёвых максималок в наличии, и пока они не расширятся за деньги новых чтобы стабилизировать всех, будет печалька.

Как по мне, сейчас 180 баксов в год за средний тариф минимакс, самое вкусное что есть

Chillingwilli 13 апр в 13:26

Гугл палит не только по IP, но и по телеметрии браузера, таймзонам и хистори аккаунта. Если акк старый и трастовый, они сквозь пальцы смотрят на прыжки по впн

Triton5 12 апр в 12:23

В чате ещё очень хорош Qwen. DeepSeek в начале года улучшили и он тоже неплох. Кстати, новый DeepSeek обещают к концу апреля.

constaprol 12 апр в 12:49

Попробуйте DNS поменять, тут как раз на Хабре статейка была как настроить свой DNS бесплатно и без смс, мне помогло.

Jacov911 12 апр в 15:41

Есть какой-то патч антигравити который вылечит это

SanCHEESE 12 апр в 18:31

Надо использовать cloudflare warp proxу для гемини, тогда утечек dns не будет

Vladimir_III 13 апр в 06:40

Для гемини поставь xbox dns и будет без впн из рф работать

НЛО прилетело и опубликовало эту надпись здесь

ColorPrint 13 апр в 17:04

Не поможет, там ip периодически менять надо, а через прокси он один

ColorPrint 13 апр в 17:03

У меня работает, и про и ультра

silentz 12 апр в 12:51

Ну, что хочу сказать, вот и закончилась эра ИИ вайб кодинга, так и не начавшись. Клод, грок, чатпгт - "внезапно" "тупеют", хотя и так стоят немало. Квен переходит на платные рельсы. Видимо денежный дождь закончился. Ну туда им и дорога... Ждем следующую итерацию ИИ лет через 10

Inoriol 13 апр в 09:31

Ну, это было очевидно. Большие коммерческие компании давали использовать свои супер ресурсы значительно дешевле чем они реально стоят. Не из-за широкой души, а чтобы посадить людей на крючок.

Дальше будет еще сильнее чувствоваться. Компании будут перекидывать простые размышления на устройства пользователей (привет Gemini Nano на пикселях и в Хроме), облачные решения станут очень ограниченными, полными рекламы, с мега долгими подписками. Наверняка и открытые модели перестанут так щедро выкладывать тоже. Капитализм, как никак.

wmlab 12 апр в 13:05

Интересно, что это за "конкурирующий продукт"? Codex? В последний раз, когда я его пробовал, он работал невыносимо медленно. Или Antigravity?

Melirius 12 апр в 15:29

А попробуйте сейчас Codex, сейчас у меня скорее Claude тормозит и тупит, чем он.

UP_IM 12 апр в 16:31

вроде как они просто /effort переключили по умолчанию на medium. В глобальном settings.json можно прописать "effortLevel": "high"

paulbir 13 апр в 06:46

Не помогает. Ещё можно adaptive thinking отключить. Но всё равно беда.

house2008 12 апр в 16:48

Банкиры начали возвращать свои вложения. Что-то у меня подозрения, что новую Миф модель сейчас раскатывают на корпорациях, если взлетит просто будут по 1-10m$ / мес с них брать, все мощи перенаправят именно туда, а из claude 4.6 сделают deepseek уровень и наконец выйдут на реальные сроки окупаемости. Если выстрелит, то и openai пойдет той же дорогой. Грустно конечно.

botyzanzylyvseNIKI 13 апр в 02:19

Они уже все пошли этой дорогой и давно. Анонс новой модели-крутые тесты - народ бежит за подпиской- через х времени они втихую режут их. Вот и весь Профит. Так делали буквально все гпт гимини теперь и Клод. Неимоверно тупорылые стали просто юзлесс

SolidSnack 13 апр в 04:14

Тут будут люди писать, которые кричали про то что опыт и знания теперь ничего не стоят ведь есть иишечка?))

MaxmaxmaximusFree 13 апр в 11:48

Квартиру продавать)

vaslobas 13 апр в 08:12

При запуске новой модели вычислительные мощности перераспределяются в её пользу - старые модели начинают работать хуже, так как с них снимают ресурсы. Бенчмарки для моделей уже собраны, новости отгремели. Заодно с выходом новой модели у пользователей будет эффект ВАУ, потому что старая-то отупела уже как пару месяцев.

Это не первое наблюдение, именно из-за заметного ухудшения качества ChatGPT в похожий момент и произошёл мой переход на Claude.

denticulus 13 апр в 10:06

Звучит как повод для коллективного иска, как в случае замедления CPU на iPhone

lotse8 13 апр в 11:18

ChatGPT по этому поводу выдал такое: “критичный инженерный процесс нельзя строить на непрозрачном внешнем поведении модели, которое поставщик может поменять без вашего контроля”

Подробнее

Главный вывод: критичный инженерный процесс нельзя строить на внешней модели, чье поведение поставщик может поменять в любой момент без контроля со стороны клиента.

Из этого для пользователей и команд следуют такие практические шаги.

Сначала снижается уровень доверия к модели. Ее перестают использовать как автономного исполнителя и переводят в режим помощника: предлагать код, объяснять diff, искать варианты, но не вносить критичные изменения без проверки.

Дальше пользователи усиливают контроль:
обязательные тесты, линтеры, CI-проверки, code review, запрет на auto-accept изменений, правило “сначала прочитай файлы и контекст, потом редактируй”.

Следующий шаг — дробление задач. Модели дают не “сделай всю инженерную работу”, а узкие и проверяемые задачи:
исправь конкретный баг, обнови тест, переведи модуль на новый API, добавь логирование по шаблону.

После этого команды начинают уходить в локальные или гибридные решения. Логика простая: если внешняя модель нестабильна, то важные участки процесса лучше переносить в контур, который компания контролирует сама.

На практике пользователи будут делать не ставку на одну “умную универсальную модель”, а на узкоспециализированные локальные модели под конкретный язык или стек:
Java для корпоративного backend,
C++ для системного кода,
Python для внутренних сервисов и data-задач.

Такие модели дообучают не на всем подряд, а на собственных репозиториях, принятых PR, комментариях ревьюеров, внутренних стандартах и типовых патчах. Это дает не максимальную “общую умность”, а предсказуемость на своих задачах.

Что будут делать крупные фирмы в ближайшие 2–3 года:
они будут инвестировать не столько в “свою большую модель”, сколько в свой автономный инженерный контур — локальные модели, внутренние бенчмарки, контроль качества, правила безопасности и маршрутизацию задач между локальными и облачными системами.

На уровне пользователя это означает такой новый рабочий режим:
внешние модели — для сложных идей, поиска вариантов, архитектурных набросков;
локальные модели — для повторяемых, чувствительных и критичных инженерных задач.

Итог в одной формуле:
при нестабильности внешних моделей пользователи сначала усиливают проверки, потом ограничивают автономию, а затем переносят важные процессы в собственный локальный или гибридный контур.

MaxmaxmaximusFree 13 апр в 11:50

Сладко мажет

Chillingwilli 13 апр в 13:18

Смешно с чтого что Anthropic пытается съехать на настройки /effort. Если модель по умолчанию работает как джун после корпоратива, никакие флаги не вернут доверие энтерпрайза

Uasya88 13 апр в 14:52

Думал только у меня так последние пару месяцев. 2 pro подписки клода.

Бывает задаёшь простую задачу, в конкретном файле. в соннет режиме, он над ней думает, пишет план на 60% (???) пяти-часового лимита. Потом ещё 35% тратит на реализацию, в итоге добавляет две строки не туда, и код не пашет.

+ появились у него глюки: пишешь задачу, ждёшь план, а он вместо плана начинает сразу выполнять.

Или по среди написания тупо останавливается. Приходится перезапускать фразой "продолжай, ты не доделал".

Для эксперимента поставил кодекс. В каких-то задачах он был прям лучше клода. А в каких-то заметно хуже. И по факту получается +/- одно и то же.

Badsanta83 13 апр в 15:26

Подтверждаю, Клод скатился.... Сейчас мой топ это Kimi 2.5, подвирает временами, сует утечки, но работает в разы продуктивнее чем Клод. Оперативно генерит синтетику, прогоняет тесты, дает результат. Правда честность я проверяю параллельно на Квене, тот как был строгим судьёй так и остался

Зарегистрируйтесь на Хабре, чтобы оставить комментарий