Pull to refresh

Comments 87

Спасибо за статью:)
Вообще, эти неназываемые неконкрентные лимиты, этот какой-то рак AI индустрии:) У MiniMax хоть конкретные цифры в тарифе "Token Plan".

Да, могли бы сделать как-то более прозрачно. Понятно, что в зависимости от модели лимиты по-разному расходуются, например, за последние модели 2x usage, а в пиковые часы 3x, но даже так можно было бы опираться на 1x usage и гарантировать какое-то точное количество промптов

>Я отказался от подписки на Claude, их лимитов мне не хватало на пару промптов.

автор просто шалабол. что это за промты такие? суперсекретные конечно. я лично у клавы $20 ни разу больше 60% часового лимита не выбирал. и 15-20 недельного

На самом деле, если использовать тяжелые шаблоны для работы, вроде get-shit-done, то лимит 20-баксовой версии выбирается ОЧЕНЬ быстро.

У меня есть промт для создания рецептов готовки под себя, делится им естественно не буду , стыдно)). Суть в том что рецепты пишутся в императивном стиле, разбиваются на атомарные шаги... as code короче, если скинуть промт в текстовый файл то весит он под 16кб, сессионные лимиты на подписке за $20 улетают только так, рецепт становится годным примерно к 10ой итерации проверок и патчей

Это что-то новенькое. Я бы посмотрел.

В мире есть бесконечное количество рецептов. Любой кухни, любого вкуса, любой сложности. Все с видосиками приготовления и результатом.

Зачем нейрослоп готовить?

Допускаю, что как раз из-за бесконечности рецептов. Для себя вижу применение такое: набрать блюд, которые мне нравятся, и переработать их рецепты для meal prep более полезным по БЖУ или в сторону уменьшения калорий. Тем, кто на кето сидит, тоже может быть актуально, в основном новичкам. Я вот в жизни ничего сложнее курицы в духовке не готовил, но в последнее время все чаще задумываюсь, думаю с такой приблудой было бы проще. А все эти бесконечные рецепты с "добавить по вкусу", "жарить до готовности" - это не очень полезно начинающим. Что-то, что отфильтрует явную дичь, соберет актуальные и точные инструкции - это полезно.

Это известная проблема. И уже есть целые сайты и блогеры специализирующиеся на простых и точных рецептах. Буквально «возьмите 10 грамм соли и один килограмм мяса вот такого отруба (скажите это слово продавцу он поймёт)». Дальше умножаешь на нужный тебе вес и получаешь сколько брать.

Хоть что-то хорошее в этом мире появляется наконец, на фоне иных новостей)) а то все эти рецепты с солью на глаз и по вкусу... Да что уж там, писали бы сразу, "рецепт - возьмите мясо и приготовьте по вкусу"

Так что можно только приветствовать такое.

Как человек, прошедший путь от ненависти к рецептам "по вкусу" к тому что сам делюсь рецептами и не обхожусь без "по вкусу" сккжу что да, Вы не приготовите гарантировано нормально блюдо с первого раза. Даже ингридиенты, вода, сыр, качество мяса и помол соли и уж специи имеют значение. Это аналоговая техника. И надо нарабатывать навыки компенсации одного другим. Или идти в кафе к шефу, который их наработал. А читерство с "гарантированными рецептами" никогда правдой не было. Нам врали с самого начала. Вкус всегда был важен.

Даже интересно что конкретно за рецепты такие с которыми не справятся бесплатные планы любой крупной LLMки.

Что это за часовые лимиты такие? У клода сессионные и недельные. Выбираются махом. Если у Вас нет таких задач, это не повод обзываться.

Только они не сессионные, а 5 часовые.

Да вот ну нет же. Хоть они и пятичасовые, это вообще не отменяет того, что они сессионные. Прям вот щас смотрю в терминал и грущу, видя "Current session 100$ used" на х5 тарифе.

Что вы вкладываете в слово сессионные? Если у меня кончился лимит на 5 часов, то он кончается во всех чатах

Этот вопрос нужно адресовать Антропику. Не мой термин. Возможно, сейчас они считают, что сессия - это 5 часов во всех чатах. А завтра решат, что 3 часа с ограничением 3 чатами.

У меня за два дня (пока бан не прилетел) на Pro сессионые лимиты раза три вылетали.

Ну теперь Claude Code с GLM-5-Turbo работает (не 5.1)

Что?) лично у меня на 200$ даже codex разок закончился за 2 дня, а Клауд за 200$ за те же 2-3 дня улетает постоянно. 20$ это 3 лимита где-то полных 5ти часовых, и каждый лимит пятичасовой я за 15 мин трачу. Выходит подписки Клауд мне хватит на 45 минут в неделю. Кодекса за 20 хватает где-то на 2-3 часа. Кодекса 200$, кроме того случая, мне хватает на неделю как раз в притык

>у меня на 200$ даже codex разок закончился за 2 дня

непонятно, вы своим рукопопием гордитесь?

я пишу по английски, сразу в виде - review Blaclass.blamethod add feature/modify/finish method итд итп. 70% opus, самое тупое sonnet.

веду несколько проектов в режиме правок. одну прогу навайбил практически полностью.

иногда в конце недели даже запускаю что-то исследовательски безумное, чтобы не сгорало впустую, и всё равно не более 50% недельного тратится.

А инструменты? Я пока ручками через чат, считал что мильон токенов это ого го сколько можно накидать... А всякие оркестраторы миллионы токенов генерят за минуты, так что...

Такая подготовка к началу процессу кодинга с агентом занимает приличное время. Мне проще сэкономить свое время и попросить агента сделать эту работу за меня – а я уже решу, подходит ли мне его план решения или нет. Иногда я вообще просто скидываю описание задачи и каким я вижу решение – а на выходе я получаю готовое решение, которое мне нужно лишь проверить и проревьюить.

С лимитам codex, minimax, z.ai это работает, а с claude – нет. Это просто мой пайплайн работы, я его не навязываю, просто поясняю, почему claude мне не подходит

Посмотрел видео про сравнение подписок на Claude и Codex:
https://www.youtube.com/watch?v=JjP6NIRJeDQ

там в комментах все тоже пишут, что лимиты Claude заканчиваются быстро:

Only one small prompt now reaches my usage limit. Just one small prompt. It wasn't like that 1 month ago. Now it's usage fills so fast

Well... Claude 20 plan last 20 min and I have to wait 4:40 hours haha

Это значит, что у вас простые задачи, маленькая кодовая база и тп. У меня на opus 4.6 лимит после 5-6 ревью чужих задач недельный лимит улетает. Только это задачи от 1000 строк. Так же в простое анализ возможных влияний, зависимостей и тп

Написал, как есть. Первый промпт в planning mode на Opus, второй промпт реализация плана на Sonnet. И уже во время реализации плана заканчиваются квоты

Мне кажется нужно в реальном времени рассчитывать стоимость запросов, хотя бы приблизительно тогда можно понимать сколько потрачено будет, и даже каким образом делать ограничения что лимиты не израходовать быстро. Например большой промт и задача, система оценивает приблизительно расход, и пользователь корректирует промт, исходя из своих лимитов и бюджета.

По информации на странице: https://docs.z.ai/devpack/faq

  • Lite Plan: Up to ~80 prompts every 5 hours — about 3× the usage quota of the Claude Pro plan.

  • Pro Plan: Up to ~400 prompts every 5 hours — about 5× the usage quota of the Lite plan.

  • Max Plan: Up to ~1600 prompts every 5 hours — about 4× the usage quota of the Pro plan.

    Неужели у Claude сейчас такие низкие лимиты?

У Claude низкие лимиты, но этом компенсируется тем, что оно обычно с первого раза делает, что нужно.

Нормальные у них лимиты, на плюс подписке надо в 2-3 проекта кодить одновременно что бы них упереться. И через каждые 2 часа они обнуляются

Смотря какой проект, сколько и каких задач. На счёт каждые 2 часа вы что то путаете, там 5-часовые лимиты и недельные

Я не пробовал никакой подписки, кроме базовой за 20 баксов, мне одному ее не хватает как правило ни 5-часовой (Pro users ($20/mo) typically get 10-40 prompts per 5 hours), ни недельной. Я вайбкодер-любитель, если бы я шпарил по ТЗ заказчиков, думаю еще хуже дела бы обстояли. В этом месяце впервые "прогрелся" купить второй аккаунт, чтобы перекрыть недостаточность первого ;)

В следующий раз наверное действительно есть смысл брать план за 100 баксов. Для сравнения, на ChatGPT Codex я ни разу не уперся в лимиты. Хотя, справедливости ради, пользовался всего месяц.

Вайбкодер. Подписка зв 20$. Вы себя вообще слышите со стороны?
Это как пытаться печь шоколадный торт из маленькой конфеты.

А разве не в этом и чуть? Ещё чуть покиньте к тарифам Клауда (как люди по 3-4 аккаунта с масками гоняют), так можно и кожаного нанять :))

Нет. У меня подписка Max за 100$, ее хватает на основной работает весь день закрывать задачи + делать собственные проекты и разного рода приложения для себя. И все еще на Opus c режимом мышления. На работе проекты на 500к строк суммарно, собственные еще сложнее, но с меньшим количеством строк.
Поэтому меня удивляют вайбкодеры, пытающиеся работать на 20$, да еще и с моделями отстающими от Opus. Дело в том, что Opus решает комплексно и быстрее, чем итерации с Sonnet. Выходит лучше, выгоднее и без нервотрепки.
Я бы сейчас делал так - консолидировал задачи на собственных проектах и на месяц бы взял 100$, а не 3 по 20$, если это требует больших фич, нагрузки и т.п.

Проект на 500 тыс строк - это не большой проект.

С точки зрения ИИ инструмента - большой.

Математика простая: одного аккаунта мне не хватает, двух - хватает с натяжкой, x5 лимиты на Max за 100 баксов будут простаивать.

Один простенький промпт опусу (когда ему тем не менее нужно пошвриться по проекту) съедает половину 5-часового лимита с $20 подпиской. У гпт такой же промпт съест не более 5%. А по качеству работы модели у них очень близки.

видимо все сильно зависит от проекта. поскольку я с такими проблемами не сталкивался.

Я сравнивал на одном проекте. Даже с соннетом лимиты исчерпывались быстрее чем с гпт, а соннет ощутимо тупее как опуса там и гпт.

Каждые 5 часов. А недельные лимиты никто не отменял.

Смотря какого размера проект. Легаси на миллионы строк кода и тысячи файлов у вас?

Спасибо, добрый человек!

Когда я впервые увидел цену международной версии плана кодирования GLM, она оказалась намного дороже, чем внутренняя

а какая цена была раньше? Если переводить в доллары, получается подписка про за 21.56$ вместо 30$

Жаль, что рыночная конкуренция закончилась, а в прошлом месяце было дешевле

Закончились не конкуренция а период заманивания клиентов, вы реально думали что вливая миллиарды долларов цена будет 20 долларов за большие объемы?

Друзья, мне codex от OpenAi сильно импонирует, но я пока не понял, можно ли его по подписке подключить к Openclaw?
Показалось что OpenClaw требует именно api токен, то есть pay-as-go модель оплаты.
Если кто имел опыт поделитесь пожалуйста.

Можно через прокси типа CLIProxyAPI, но могут забаннить. Опенай меня за такое пока не баннил, а вот гугл быстро забаннил :)

А как платить за Gemini из РФ? Всё работает через правильный КВН, думаешь, не занести ли гуглу уже денег? Пытаешься посмотреть бенефиты - и тут же "ваша учётка не проходит фейс-контроль".

Я брал готовый акк с подпиской, для кодинга пофиг - привязываешь его к их антигравити и страдаешь от того какое оно примитивное. Можно бесплатный привязать и посмотреть доступно или нет по стране. Если что лмиты на клод там очень низкие на про, тупо для галочки модели доступны, если нужен клод брать гугл нет смысла.

Да. Я как раз так так и пользуюсь OpenClaw, там можно авторизоваться через oAuth, и все модели станут доступны по подписке. Себе и девушке так и сделал

Можно, в OpenClaw есть встроенный механизм для этого. Сам так использую.

Пока OpenAI на это закрывает глаза, они в целом позволяют пока использовать подписку в других инструментах (OpenCode как пример). И, учитывая, что они заняли создателя OpenClaw, то если что-то изменится, то они об этом сначала объявят, а не начнут тихо банить.

Anthropic же обновил ToS и запретил это явно.

А я думал, что эта возможность появилась уже после того, как openAI выкупили OpenClaw. То есть, это на самом деле не согласовано никак с openai изначально?

Нет, не согласовано. Просто OpenAI пока всё ещё это позволяет (сейчас они в стадии погони за Anthropic в B2B/агентах), а Anthropic стали просить разработчиков убирать такую возможность из своих агентах, а пользователей банить (изменили ToS для этого).

Окей. Теперь вопрос ждать ли бана от клод или переходить на OpenAI,
С клодом OpenClaw прям по красоте работает.
Не будет ли просадки по качеству после миграции на Codex.
Но это наверное не узнаю пока не попробую.

Или можно завести аккаунт, который не жалко :)

На моем рабочем нет никакой возможности подключить впн

Можно поднять локальный сингбокс как http proxy и перенаправить трафик Клода в него с помощью переменных окружения.

Можно также и весь трафик перехватывать и просто большую часть направлять обратно в интерфейс корпоративного ВПН - несколько более замороченный вариант, зато без прокси.

А еще можно спокойно проксировать запросы к API западных нейросеток через huggingface, подняв там бесплатно docker контейнер в spaces с каким-нибудь nginx reverse proxy. Я там вообще поднял обратный ssh-socks5 для своего удобства. Не думаю, что в конторе где нужны нейросети, нет huggingface в белых списках.

socks5 соединения просто дропаются, а huggingface заблочен

ps: без корп. впна доступа в интернет вообще нет, а при подключении вообще весь трафик в интернет идет через него, неразрешенный трафик фильтруется

Согласен, glm модель классная, но сам провайдер просто ужасный, они постоянно тротлят и нерфят модель, чтобы выделять мощности на тренировку модели.

Я отказался от подписки на Claude, их лимитов мне не хватало на пару промптов.

Что ж это за пропмты то такие?

В каком нибудь mono-репозитории с большой кодовой базой, попробуйте в planned-mode задать какой нибудь промпт по построению/рефакторингу архитектуры, в режиме /effort max.
Лимит сессии часовой слетит мгновенно, у меня так по крайней мере.

Нужно брать нормальную подписку за 100$ в месяц, а не эту за 20 для студентов. И настраивать окружение для работы с моделью. На подписке за 100$ и настроенном контекст окружении никогда не упирались в лимиты на опус4.6 при работе с моделью 24 часа в сутки на нескольких задачах параллельно

100 мало. У меня расход в месяц 300-500. Иногда один чат на 20 итераций может съесть 20$. А это 1 день работы.

Это проблема неправильной работы с контекстом. Нужно устанавливать специальный инструмент для Claude code, чтобы не гоняло в атморфик ненужные данные.

У chatgpt тоже лимиты не пишут, но они весьма маленькие как пишут пользователи

На плюс подписке ни разу в лимиты не упирался при активной разработке

Ну, повезло, что сказать, но не всем — https://github.com/openai/codex/issues/14593

У меня вот PRO за $200 улетает бодро, хотя до релиза 5.4 действительно было очень тяжело выесть лимиты.

пробовали отключать плагины, как советует в комментах к issue?

Codex app сейчас дают x2 лимитов и очень экономно использует токены. На 5.4 не включайте fast

Именно агентом? Интернет показывает 33 запроса в 5 часов, это ничто, о, обенно для активной разработки

На неделе пробовал перейти на их Coding Plan. Первое что оттолкнуло - очень хитрый недельный лимит. Если 5-часовой лимит в них +/- адекватный, то недельный равен всего лишь 6-ти таким лимитам, то есть активно работать Z.AI даёт максимум 20-30 часов в неделю или 3 загруженных дня.

Но главная проблема - то, насколько их модели тупы и подвержены цикличности. До 20-30 тыс. токенов все идёт прекрасно, но стоит поработать в одном контексте больше 10 минут и они сходят с ума, теряя способность даже вызывать tools.

А зачем работать в одном контексте подолгу? Декомпозиция на подзадачи и каждый шаг в новой сессии - у меня нормально такой подход работает. Да и при приближении к 100к контекста проблем не было (Pro-план, GLM-5)

Мне что-то glm вообще не зашёл. Задачи не доделывает, подтупливает.

Очень круто и полезно, спасибо

Вижу вы многие модели попробовали, что-нибудь можете сказать насчет MiMoV2 Pro?

Сталкивался с тем, что на относительно небольшом контексте (~100к токенов) оно начинает сыпаться в откровенную дичь. Ризонинг превращается в набор случайных слов, символов, математических выражений. Поговаривают, что з.аи очень сильно квантизирует свои модели. Поэтому я в тот же месяц отменил и рефанднул подписку.

Удивительно, что на lite подписке glm 5.1 тоже доступна, только что проверил. Потому что glm 5 там до сих пор недоступна. Но вообще та же glm 4.7 там работала очень медленно и если контекст разрастался - переходила на китайский и начинала творить дичь. Иногда отвечала очень медленно. Да, подписка стоит копейки, но даже этих копеек она не стоит сейчас, потому что невозможно работать нормально с теми моделями что есть, ещё посмотрим на glm 5.1 насколько хорошо будет работать, но что-то я сомневаюсь

Имеем годовую подписку на glm, но в разработке используем opus4.6. Разница в анализе кода с китайцем очень сильна. Glm в основном для небольших задач и rag.

Насколько по вашему мнению glm 5 и 5.1 продвинулись в сравнении с 4.6? Когда я пробовал 4.6, то она была на уровне от силы claude haiku - вроде бы может решить многие задачи на проекте, но при этом часто путается, проект может не собираться из-за мелких ошибок.
А однажды glm 4.6 было сказано дописать изменения в существующий файл - она якобы не нашла его, но при этом стерла этот файл и полностью перезаписала своим содержимым, чего никогда не было с claude/kimi.

Ночью цены на планы обновили :-/

Мне щас пишут за один месяц

  • 18 за Lite

  • 72 за Pro

  • 160 за Max

да, обновили(, но я вижу ты успел подписаться на Pro? Если подписался до изменения цены, то условия должны сохраниться

Да, хотел провести эксперимент, но он неожиданно вышел из контроля 🤣

Хочу заметить, что последние два дня очень большие ожидания, на больших контекстах полно быть 40 минут, может быть 80.

Мне кажется, народ ломанулся, и они экстренно подняли ценник. Чтобы уменьшить наплыв и нагрузку на вычислительные мощности.

Да, у меня такая же проблема, очень тормозить стал GLM, из-за этого теперь приходится пользоваться другой подпиской

Sign up to leave a comment.

Other news