Обновить

Комментарии 35

Инфляция К(л)ода

Просто Антропиков жадность обуяла.

А за что минус-то? Ведь реально обман клиентов.

Не жадность, а юнит-экономика, бесконечно субсидировать вайб-кодинг они не могут

НЛО прилетело и опубликовало эту надпись здесь

Гемини, основной акк, из рф, на телефоне стоит, гео включено, постоянно отлетает впн. Работает и гемини, и антигравити. А последний так даже без впн работает, и опус в том числе.

GLM 5.1 попробуйте - весьма не дурно

GLM вроде подорожал сегодня, жалко

До Клода все ещё далеко

Глм нравится. После дипсика прям хорошо. Даже 5ый сильно круче, по моим личным данным. М2. 5 тоже лучше дипсика, м2.7 наверно сравним с 5.0. 5.1 нравится наверное больше всех из них. Но. Вот прям сейчас она не работает. В Китае высокие часы, и просто ловит постоянно "сервер бизи" . И это минимальнейшая проблема. Основная - после 100к контекста может гнать бессвязный мусор. Вот прям вообще. Я такого треша нигде не видел. Они на лету крутят конфиги модели, и вот когда она заряжена, она работает круто. А когда они ужали её - ну такое. Самое фиговое, что ты не знаешь как она сейчас работает. Опять же, цена. За новую цену не вижу смысла. За прошлую взял про(лайт улетает слишком быстро у меня, про почти хватает) . Но надо иметь ввиду, что до 6 фев народ тарил за копейки, с меньшими ограничениями лимитов, и эта цена будет у них и при продлении. Соответственно куча нагрузки от дешёвых максималок в наличии, и пока они не расширятся за деньги новых чтобы стабилизировать всех, будет печалька.

Как по мне, сейчас 180 баксов в год за средний тариф минимакс, самое вкусное что есть

Гугл палит не только по IP, но и по телеметрии браузера, таймзонам и хистори аккаунта. Если акк старый и трастовый, они сквозь пальцы смотрят на прыжки по впн

В чате ещё очень хорош Qwen. DeepSeek в начале года улучшили и он тоже неплох. Кстати, новый DeepSeek обещают к концу апреля.

Попробуйте DNS поменять, тут как раз на Хабре статейка была как настроить свой DNS бесплатно и без смс, мне помогло.

Есть какой-то патч антигравити который вылечит это

Надо использовать cloudflare warp proxу для гемини, тогда утечек dns не будет

Для гемини поставь xbox dns и будет без впн из рф работать

НЛО прилетело и опубликовало эту надпись здесь

Не поможет, там ip периодически менять надо, а через прокси он один

У меня работает, и про и ультра

Ну, что хочу сказать, вот и закончилась эра ИИ вайб кодинга, так и не начавшись. Клод, грок, чатпгт - "внезапно" "тупеют", хотя и так стоят немало. Квен переходит на платные рельсы. Видимо денежный дождь закончился. Ну туда им и дорога... Ждем следующую итерацию ИИ лет через 10

Ну, это было очевидно. Большие коммерческие компании давали использовать свои супер ресурсы значительно дешевле чем они реально стоят. Не из-за широкой души, а чтобы посадить людей на крючок.

Дальше будет еще сильнее чувствоваться. Компании будут перекидывать простые размышления на устройства пользователей (привет Gemini Nano на пикселях и в Хроме), облачные решения станут очень ограниченными, полными рекламы, с мега долгими подписками. Наверняка и открытые модели перестанут так щедро выкладывать тоже. Капитализм, как никак.

Интересно, что это за "конкурирующий продукт"? Codex? В последний раз, когда я его пробовал, он работал невыносимо медленно. Или Antigravity?

А попробуйте сейчас Codex, сейчас у меня скорее Claude тормозит и тупит, чем он.

вроде как они просто /effort переключили по умолчанию на medium. В глобальном settings.json можно прописать "effortLevel": "high"

Не помогает. Ещё можно adaptive thinking отключить. Но всё равно беда.

Банкиры начали возвращать свои вложения. Что-то у меня подозрения, что новую Миф модель сейчас раскатывают на корпорациях, если взлетит просто будут по 1-10m$ / мес с них брать, все мощи перенаправят именно туда, а из claude 4.6 сделают deepseek уровень и наконец выйдут на реальные сроки окупаемости. Если выстрелит, то и openai пойдет той же дорогой. Грустно конечно.

Они уже все пошли этой дорогой и давно. Анонс новой модели-крутые тесты - народ бежит за подпиской- через х времени они втихую режут их. Вот и весь Профит. Так делали буквально все гпт гимини теперь и Клод. Неимоверно тупорылые стали просто юзлесс

Тут будут люди писать, которые кричали про то что опыт и знания теперь ничего не стоят ведь есть иишечка?))

Квартиру продавать)

При запуске новой модели вычислительные мощности перераспределяются в её пользу - старые модели начинают работать хуже, так как с них снимают ресурсы. Бенчмарки для моделей уже собраны, новости отгремели. Заодно с выходом новой модели у пользователей будет эффект ВАУ, потому что старая-то отупела уже как пару месяцев.

Это не первое наблюдение, именно из-за заметного ухудшения качества ChatGPT в похожий момент и произошёл мой переход на Claude.

Звучит как повод для коллективного иска, как в случае замедления CPU на iPhone

ChatGPT по этому поводу выдал такое: “критичный инженерный процесс нельзя строить на непрозрачном внешнем поведении модели, которое поставщик может поменять без вашего контроля”

Подробнее

Главный вывод: критичный инженерный процесс нельзя строить на внешней модели, чье поведение поставщик может поменять в любой момент без контроля со стороны клиента.

Из этого для пользователей и команд следуют такие практические шаги.

Сначала снижается уровень доверия к модели. Ее перестают использовать как автономного исполнителя и переводят в режим помощника: предлагать код, объяснять diff, искать варианты, но не вносить критичные изменения без проверки.

Дальше пользователи усиливают контроль:
обязательные тесты, линтеры, CI-проверки, code review, запрет на auto-accept изменений, правило “сначала прочитай файлы и контекст, потом редактируй”.

Следующий шаг — дробление задач. Модели дают не “сделай всю инженерную работу”, а узкие и проверяемые задачи:
исправь конкретный баг, обнови тест, переведи модуль на новый API, добавь логирование по шаблону.

После этого команды начинают уходить в локальные или гибридные решения. Логика простая: если внешняя модель нестабильна, то важные участки процесса лучше переносить в контур, который компания контролирует сама.

На практике пользователи будут делать не ставку на одну “умную универсальную модель”, а на узкоспециализированные локальные модели под конкретный язык или стек:
Java для корпоративного backend,
C++ для системного кода,
Python для внутренних сервисов и data-задач.

Такие модели дообучают не на всем подряд, а на собственных репозиториях, принятых PR, комментариях ревьюеров, внутренних стандартах и типовых патчах. Это дает не максимальную “общую умность”, а предсказуемость на своих задачах.

Что будут делать крупные фирмы в ближайшие 2–3 года:
они будут инвестировать не столько в “свою большую модель”, сколько в свой автономный инженерный контур — локальные модели, внутренние бенчмарки, контроль качества, правила безопасности и маршрутизацию задач между локальными и облачными системами.

На уровне пользователя это означает такой новый рабочий режим:
внешние модели — для сложных идей, поиска вариантов, архитектурных набросков;
локальные модели — для повторяемых, чувствительных и критичных инженерных задач.

Итог в одной формуле:
при нестабильности внешних моделей пользователи сначала усиливают проверки, потом ограничивают автономию, а затем переносят важные процессы в собственный локальный или гибридный контур.

Сладко мажет

Смешно с чтого что Anthropic пытается съехать на настройки /effort. Если модель по умолчанию работает как джун после корпоратива, никакие флаги не вернут доверие энтерпрайза

Думал только у меня так последние пару месяцев. 2 pro подписки клода.

Бывает задаёшь простую задачу, в конкретном файле. в соннет режиме, он над ней думает, пишет план на 60% (???) пяти-часового лимита. Потом ещё 35% тратит на реализацию, в итоге добавляет две строки не туда, и код не пашет.

+ появились у него глюки: пишешь задачу, ждёшь план, а он вместо плана начинает сразу выполнять.

Или по среди написания тупо останавливается. Приходится перезапускать фразой "продолжай, ты не доделал".

Для эксперимента поставил кодекс. В каких-то задачах он был прям лучше клода. А в каких-то заметно хуже. И по факту получается +/- одно и то же.

Подтверждаю, Клод скатился.... Сейчас мой топ это Kimi 2.5, подвирает временами, сует утечки, но работает в разы продуктивнее чем Клод. Оперативно генерит синтетику, прогоняет тесты, дает результат. Правда честность я проверяю параллельно на Квене, тот как был строгим судьёй так и остался

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости