Yakwilik Mar 28 at 00:00

GLM-5.1 стал доступен всем пользователям Coding Plan: почти на уровне Claude Opus 4.6?

3 min

27K

Programming *

+26

Comments 87

Triton5 Mar 28 at 00:26

Спасибо за статью:)
Вообще, эти неназываемые неконкрентные лимиты, этот какой-то рак AI индустрии:) У MiniMax хоть конкретные цифры в тарифе "Token Plan".

Yakwilik Mar 28 at 03:46

Да, могли бы сделать как-то более прозрачно. Понятно, что в зависимости от модели лимиты по-разному расходуются, например, за последние модели 2x usage, а в пиковые часы 3x, но даже так можно было бы опираться на 1x usage и гарантировать какое-то точное количество промптов

Sanitir Mar 28 at 07:27

>Я отказался от подписки на Claude, их лимитов мне не хватало на пару промптов.

автор просто шалабол. что это за промты такие? суперсекретные конечно. я лично у клавы $20 ни разу больше 60% часового лимита не выбирал. и 15-20 недельного

nidalee Mar 28 at 07:31

На самом деле, если использовать тяжелые шаблоны для работы, вроде get-shit-done, то лимит 20-баксовой версии выбирается ОЧЕНЬ быстро.

t38c3j Mar 28 at 07:43

У меня есть промт для создания рецептов готовки под себя, делится им естественно не буду , стыдно)). Суть в том что рецепты пишутся в императивном стиле, разбиваются на атомарные шаги... as code короче, если скинуть промт в текстовый файл то весит он под 16кб, сессионные лимиты на подписке за $20 улетают только так, рецепт становится годным примерно к 10ой итерации проверок и патчей

nidalee Mar 28 at 07:57

Это что-то новенькое. Я бы посмотрел.

BugM Mar 28 at 08:09

В мире есть бесконечное количество рецептов. Любой кухни, любого вкуса, любой сложности. Все с видосиками приготовления и результатом.

Зачем нейрослоп готовить?

nidalee Mar 28 at 08:17

Допускаю, что как раз из-за бесконечности рецептов. Для себя вижу применение такое: набрать блюд, которые мне нравятся, и переработать их рецепты для meal prep более полезным по БЖУ или в сторону уменьшения калорий. Тем, кто на кето сидит, тоже может быть актуально, в основном новичкам. Я вот в жизни ничего сложнее курицы в духовке не готовил, но в последнее время все чаще задумываюсь, думаю с такой приблудой было бы проще. А все эти бесконечные рецепты с "добавить по вкусу", "жарить до готовности" - это не очень полезно начинающим. Что-то, что отфильтрует явную дичь, соберет актуальные и точные инструкции - это полезно.

BugM Mar 28 at 08:53

Это известная проблема. И уже есть целые сайты и блогеры специализирующиеся на простых и точных рецептах. Буквально «возьмите 10 грамм соли и один килограмм мяса вот такого отруба (скажите это слово продавцу он поймёт)». Дальше умножаешь на нужный тебе вес и получаешь сколько брать.

ITDiver77 Mar 28 at 18:54

Хоть что-то хорошее в этом мире появляется наконец, на фоне иных новостей)) а то все эти рецепты с солью на глаз и по вкусу... Да что уж там, писали бы сразу, "рецепт - возьмите мясо и приготовьте по вкусу"

Так что можно только приветствовать такое.

SwingoPingo Mar 28 at 20:11

Как человек, прошедший путь от ненависти к рецептам "по вкусу" к тому что сам делюсь рецептами и не обхожусь без "по вкусу" сккжу что да, Вы не приготовите гарантировано нормально блюдо с первого раза. Даже ингридиенты, вода, сыр, качество мяса и помол соли и уж специи имеют значение. Это аналоговая техника. И надо нарабатывать навыки компенсации одного другим. Или идти в кафе к шефу, который их наработал. А читерство с "гарантированными рецептами" никогда правдой не было. Нам врали с самого начала. Вкус всегда был важен.

liquidgel Mar 28 at 23:47

Даже интересно что конкретно за рецепты такие с которыми не справятся бесплатные планы любой крупной LLMки.

Fodin Mar 28 at 07:56

Что это за часовые лимиты такие? У клода сессионные и недельные. Выбираются махом. Если у Вас нет таких задач, это не повод обзываться.

horses Mar 28 at 20:29

Только они не сессионные, а 5 часовые.

Fodin Mar 29 at 02:14

Да вот ну нет же. Хоть они и пятичасовые, это вообще не отменяет того, что они сессионные. Прям вот щас смотрю в терминал и грущу, видя "Current session 100$ used" на х5 тарифе.

horses Mar 30 at 09:30

Что вы вкладываете в слово сессионные? Если у меня кончился лимит на 5 часов, то он кончается во всех чатах

Fodin Mar 30 at 10:10

Этот вопрос нужно адресовать Антропику. Не мой термин. Возможно, сейчас они считают, что сессия - это 5 часов во всех чатах. А завтра решат, что 3 часа с ограничением 3 чатами.

vikarti Mar 28 at 08:47

У меня за два дня (пока бан не прилетел) на Pro сессионые лимиты раза три вылетали.

Ну теперь Claude Code с GLM-5-Turbo работает (не 5.1)

Tesold Mar 28 at 15:52

Что?) лично у меня на 200$ даже codex разок закончился за 2 дня, а Клауд за 200$ за те же 2-3 дня улетает постоянно. 20$ это 3 лимита где-то полных 5ти часовых, и каждый лимит пятичасовой я за 15 мин трачу. Выходит подписки Клауд мне хватит на 45 минут в неделю. Кодекса за 20 хватает где-то на 2-3 часа. Кодекса 200$, кроме того случая, мне хватает на неделю как раз в притык

Sanitir Mar 28 at 16:37

>у меня на 200$ даже codex разок закончился за 2 дня

непонятно, вы своим рукопопием гордитесь?

я пишу по английски, сразу в виде - review Blaclass.blamethod add feature/modify/finish method итд итп. 70% opus, самое тупое sonnet.

веду несколько проектов в режиме правок. одну прогу навайбил практически полностью.

иногда в конце недели даже запускаю что-то исследовательски безумное, чтобы не сгорало впустую, и всё равно не более 50% недельного тратится.

ITDiver77 Mar 28 at 18:56

А инструменты? Я пока ручками через чат, считал что мильон токенов это ого го сколько можно накидать... А всякие оркестраторы миллионы токенов генерят за минуты, так что...

Yakwilik Mar 29 at 01:39

Такая подготовка к началу процессу кодинга с агентом занимает приличное время. Мне проще сэкономить свое время и попросить агента сделать эту работу за меня – а я уже решу, подходит ли мне его план решения или нет. Иногда я вообще просто скидываю описание задачи и каким я вижу решение – а на выходе я получаю готовое решение, которое мне нужно лишь проверить и проревьюить.

С лимитам codex, minimax, z.ai это работает, а с claude – нет. Это просто мой пайплайн работы, я его не навязываю, просто поясняю, почему claude мне не подходит

Yakwilik Mar 30 at 02:39

Посмотрел видео про сравнение подписок на Claude и Codex:
https://www.youtube.com/watch?v=JjP6NIRJeDQ

там в комментах все тоже пишут, что лимиты Claude заканчиваются быстро:

Only one small prompt now reaches my usage limit. Just one small prompt. It wasn't like that 1 month ago. Now it's usage fills so fast

Well... Claude 20 plan last 20 min and I have to wait 4:40 hours haha

horses Mar 28 at 20:27

Это значит, что у вас простые задачи, маленькая кодовая база и тп. У меня на opus 4.6 лимит после 5-6 ревью чужих задач недельный лимит улетает. Только это задачи от 1000 строк. Так же в простое анализ возможных влияний, зависимостей и тп

Yakwilik Mar 29 at 00:59

Написал, как есть. Первый промпт в planning mode на Opus, второй промпт реализация плана на Sonnet. И уже во время реализации плана заканчиваются квоты

criminalist Mar 28 at 08:38

Мне кажется нужно в реальном времени рассчитывать стоимость запросов, хотя бы приблизительно тогда можно понимать сколько потрачено будет, и даже каким образом делать ограничения что лимиты не израходовать быстро. Например большой промт и задача, система оценивает приблизительно расход, и пользователь корректирует промт, исходя из своих лимитов и бюджета.

Triton5 Mar 28 at 01:20

По информации на странице: https://docs.z.ai/devpack/faq

Lite Plan: Up to ~80 prompts every 5 hours — about 3× the usage quota of the Claude Pro plan.
Pro Plan: Up to ~400 prompts every 5 hours — about 5× the usage quota of the Lite plan.
Max Plan: Up to ~1600 prompts every 5 hours — about 4× the usage quota of the Pro plan.

Неужели у Claude сейчас такие низкие лимиты?

nidalee Mar 28 at 03:24

У Claude низкие лимиты, но этом компенсируется тем, что оно обычно с первого раза делает, что нужно.

lithium_li Mar 28 at 07:33

Нормальные у них лимиты, на плюс подписке надо в 2-3 проекта кодить одновременно что бы них упереться. И через каждые 2 часа они обнуляются

thethee Mar 28 at 07:47

Смотря какой проект, сколько и каких задач. На счёт каждые 2 часа вы что то путаете, там 5-часовые лимиты и недельные

nidalee Mar 28 at 07:50

Я не пробовал никакой подписки, кроме базовой за 20 баксов, мне одному ее не хватает как правило ни 5-часовой (Pro users ($20/mo) typically get 10-40 prompts per 5 hours), ни недельной. Я вайбкодер-любитель, если бы я шпарил по ТЗ заказчиков, думаю еще хуже дела бы обстояли. В этом месяце впервые "прогрелся" купить второй аккаунт, чтобы перекрыть недостаточность первого ;)

В следующий раз наверное действительно есть смысл брать план за 100 баксов. Для сравнения, на ChatGPT Codex я ни разу не уперся в лимиты. Хотя, справедливости ради, пользовался всего месяц.

alexmasyukov Mar 28 at 11:08

Вайбкодер. Подписка зв 20$. Вы себя вообще слышите со стороны?
Это как пытаться печь шоколадный торт из маленькой конфеты.

burandby Mar 28 at 11:21

А разве не в этом и чуть? Ещё чуть покиньте к тарифам Клауда (как люди по 3-4 аккаунта с масками гоняют), так можно и кожаного нанять :))

alexmasyukov Mar 28 at 11:26

Нет. У меня подписка Max за 100$, ее хватает на основной работает весь день закрывать задачи + делать собственные проекты и разного рода приложения для себя. И все еще на Opus c режимом мышления. На работе проекты на 500к строк суммарно, собственные еще сложнее, но с меньшим количеством строк.
Поэтому меня удивляют вайбкодеры, пытающиеся работать на 20$, да еще и с моделями отстающими от Opus. Дело в том, что Opus решает комплексно и быстрее, чем итерации с Sonnet. Выходит лучше, выгоднее и без нервотрепки.
Я бы сейчас делал так - консолидировал задачи на собственных проектах и на месяц бы взял 100$, а не 3 по 20$, если это требует больших фич, нагрузки и т.п.

horses Mar 28 at 20:38

Проект на 500 тыс строк - это не большой проект.

alexmasyukov Apr 2 at 10:46

С точки зрения ИИ инструмента - большой.

nidalee Mar 28 at 13:07

Математика простая: одного аккаунта мне не хватает, двух - хватает с натяжкой, x5 лимиты на Max за 100 баксов будут простаивать.

equeim Mar 28 at 09:54

Один простенький промпт опусу (когда ему тем не менее нужно пошвриться по проекту) съедает половину 5-часового лимита с $20 подпиской. У гпт такой же промпт съест не более 5%. А по качеству работы модели у них очень близки.

lithium_li Mar 28 at 09:56

видимо все сильно зависит от проекта. поскольку я с такими проблемами не сталкивался.

equeim Mar 28 at 10:05

Я сравнивал на одном проекте. Даже с соннетом лимиты исчерпывались быстрее чем с гпт, а соннет ощутимо тупее как опуса там и гпт.

horses Mar 28 at 20:35

Каждые 5 часов. А недельные лимиты никто не отменял.

Смотря какого размера проект. Легаси на миллионы строк кода и тысячи файлов у вас?

ITDiver77 Mar 28 at 18:57

Спасибо, добрый человек!

so_linrun Mar 28 at 01:25

Когда я впервые увидел цену международной версии плана кодирования GLM, она оказалась намного дороже, чем внутренняя

Yakwilik Mar 28 at 03:42

а какая цена была раньше? Если переводить в доллары, получается подписка про за 21.56$ вместо 30$

so_linrun Mar 28 at 06:45

Жаль, что рыночная конкуренция закончилась, а в прошлом месяце было дешевле

tot0ro Mar 28 at 08:31

Закончились не конкуренция а период заманивания клиентов, вы реально думали что вливая миллиарды долларов цена будет 20 долларов за большие объемы?

mgis Mar 28 at 02:46

Друзья, мне codex от OpenAi сильно импонирует, но я пока не понял, можно ли его по подписке подключить к Openclaw?
Показалось что OpenClaw требует именно api токен, то есть pay-as-go модель оплаты.
Если кто имел опыт поделитесь пожалуйста.

Barnaby Mar 28 at 03:10

Можно через прокси типа CLIProxyAPI, но могут забаннить. Опенай меня за такое пока не баннил, а вот гугл быстро забаннил :)

sundmoon Mar 28 at 14:14

А как платить за Gemini из РФ? Всё работает через правильный КВН, думаешь, не занести ли гуглу уже денег? Пытаешься посмотреть бенефиты - и тут же "ваша учётка не проходит фейс-контроль".

Barnaby Mar 28 at 14:29

Я брал готовый акк с подпиской, для кодинга пофиг - привязываешь его к их антигравити и страдаешь от того какое оно примитивное. Можно бесплатный привязать и посмотреть доступно или нет по стране. Если что лмиты на клод там очень низкие на про, тупо для галочки модели доступны, если нужен клод брать гугл нет смысла.

Yakwilik Mar 28 at 03:40

Да. Я как раз так так и пользуюсь OpenClaw, там можно авторизоваться через oAuth, и все модели станут доступны по подписке. Себе и девушке так и сделал

cool8 Mar 28 at 03:43

Можно, в OpenClaw есть встроенный механизм для этого. Сам так использую.

Пока OpenAI на это закрывает глаза, они в целом позволяют пока использовать подписку в других инструментах (OpenCode как пример). И, учитывая, что они заняли создателя OpenClaw, то если что-то изменится, то они об этом сначала объявят, а не начнут тихо банить.

Anthropic же обновил ToS и запретил это явно.

Yakwilik Mar 28 at 03:50

А я думал, что эта возможность появилась уже после того, как openAI выкупили OpenClaw. То есть, это на самом деле не согласовано никак с openai изначально?

cool8 Mar 28 at 07:14

Нет, не согласовано. Просто OpenAI пока всё ещё это позволяет (сейчас они в стадии погони за Anthropic в B2B/агентах), а Anthropic стали просить разработчиков убирать такую возможность из своих агентах, а пользователей банить (изменили ToS для этого).

mgis Mar 28 at 06:55

Окей. Теперь вопрос ждать ли бана от клод или переходить на OpenAI,
С клодом OpenClaw прям по красоте работает.
Не будет ли просадки по качеству после миграции на Codex.
Но это наверное не узнаю пока не попробую.

cool8 Mar 28 at 07:15

Или можно завести аккаунт, который не жалко :)

Suor Mar 28 at 04:44

На моем рабочем нет никакой возможности подключить впн

Можно поднять локальный сингбокс как http proxy и перенаправить трафик Клода в него с помощью переменных окружения.

Можно также и весь трафик перехватывать и просто большую часть направлять обратно в интерфейс корпоративного ВПН - несколько более замороченный вариант, зато без прокси.

rendov Mar 28 at 07:40

А еще можно спокойно проксировать запросы к API западных нейросеток через huggingface, подняв там бесплатно docker контейнер в spaces с каким-нибудь nginx reverse proxy. Я там вообще поднял обратный ssh-socks5 для своего удобства. Не думаю, что в конторе где нужны нейросети, нет huggingface в белых списках.

Yakwilik Mar 29 at 00:54

socks5 соединения просто дропаются, а huggingface заблочен

ps: без корп. впна доступа в интернет вообще нет, а при подключении вообще весь трафик в интернет идет через него, неразрешенный трафик фильтруется

headliner1985 Mar 28 at 04:58

Согласен, glm модель классная, но сам провайдер просто ужасный, они постоянно тротлят и нерфят модель, чтобы выделять мощности на тренировку модели.

mst_72 Mar 28 at 06:43

Я отказался от подписки на Claude, их лимитов мне не хватало на пару промптов.

Что ж это за пропмты то такие?

mgis Mar 28 at 08:56

В каком нибудь mono-репозитории с большой кодовой базой, попробуйте в planned-mode задать какой нибудь промпт по построению/рефакторингу архитектуры, в режиме /effort max.
Лимит сессии часовой слетит мгновенно, у меня так по крайней мере.

aladkoi Mar 29 at 18:53

Нужно брать нормальную подписку за 100$ в месяц, а не эту за 20 для студентов. И настраивать окружение для работы с моделью. На подписке за 100$ и настроенном контекст окружении никогда не упирались в лимиты на опус4.6 при работе с моделью 24 часа в сутки на нескольких задачах параллельно

v_chaser Apr 1 at 00:08

100 мало. У меня расход в месяц 300-500. Иногда один чат на 20 итераций может съесть 20$. А это 1 день работы.

aladkoi Apr 1 at 18:21

Это проблема неправильной работы с контекстом. Нужно устанавливать специальный инструмент для Claude code, чтобы не гоняло в атморфик ненужные данные.

Sneg47 Mar 28 at 07:13

У chatgpt тоже лимиты не пишут, но они весьма маленькие как пишут пользователи

lithium_li Mar 28 at 07:34

На плюс подписке ни разу в лимиты не упирался при активной разработке

constXife Mar 28 at 07:54

Ну, повезло, что сказать, но не всем — https://github.com/openai/codex/issues/14593

У меня вот PRO за $200 улетает бодро, хотя до релиза 5.4 действительно было очень тяжело выесть лимиты.

lithium_li Mar 28 at 09:27

пробовали отключать плагины, как советует в комментах к issue?

horses Mar 28 at 20:44

Codex app сейчас дают x2 лимитов и очень экономно использует токены. На 5.4 не включайте fast

Sneg47 Mar 28 at 09:04

Именно агентом? Интернет показывает 33 запроса в 5 часов, это ничто, о, обенно для активной разработки

lithium_li Mar 28 at 09:26

именно агентом через codex cli. 33 это минимум при максимальной загрузке серверов openAI. максимум 168, так что думаю в среднем там сильно больше чем 33

https://developers.openai.com/codex/pricing?codex-usage-limits=gpt-5-4#what-are-the-usage-limits-for-my-plan

arahismsn Mar 28 at 11:30

На неделе пробовал перейти на их Coding Plan. Первое что оттолкнуло - очень хитрый недельный лимит. Если 5-часовой лимит в них +/- адекватный, то недельный равен всего лишь 6-ти таким лимитам, то есть активно работать Z.AI даёт максимум 20-30 часов в неделю или 3 загруженных дня.

Но главная проблема - то, насколько их модели тупы и подвержены цикличности. До 20-30 тыс. токенов все идёт прекрасно, но стоит поработать в одном контексте больше 10 минут и они сходят с ума, теряя способность даже вызывать tools.

Triton5 Mar 28 at 23:54

А MiniMax пробовали? У них тарифные планы какие-то очень большие.

https://platform.minimax.io/subscribe/token-plan

Yakwilik Mar 29 at 00:55

Я пробовал, я бы сказал неплохо

Damnt Apr 2 at 21:33

А зачем работать в одном контексте подолгу? Декомпозиция на подзадачи и каждый шаг в новой сессии - у меня нормально такой подход работает. Да и при приближении к 100к контекста проблем не было (Pro-план, GLM-5)

Sidrez Mar 28 at 16:10

Мне что-то glm вообще не зашёл. Задачи не доделывает, подтупливает.

OtterLi Mar 28 at 16:11

Очень круто и полезно, спасибо

SafeCodee Mar 28 at 18:54

Вижу вы многие модели попробовали, что-нибудь можете сказать насчет MiMoV2 Pro?

Craftist Mar 29 at 11:05

Сталкивался с тем, что на относительно небольшом контексте (~100к токенов) оно начинает сыпаться в откровенную дичь. Ризонинг превращается в набор случайных слов, символов, математических выражений. Поговаривают, что з.аи очень сильно квантизирует свои модели. Поэтому я в тот же месяц отменил и рефанднул подписку.

greenrus Mar 29 at 15:45

Удивительно, что на lite подписке glm 5.1 тоже доступна, только что проверил. Потому что glm 5 там до сих пор недоступна. Но вообще та же glm 4.7 там работала очень медленно и если контекст разрастался - переходила на китайский и начинала творить дичь. Иногда отвечала очень медленно. Да, подписка стоит копейки, но даже этих копеек она не стоит сейчас, потому что невозможно работать нормально с теми моделями что есть, ещё посмотрим на glm 5.1 насколько хорошо будет работать, но что-то я сомневаюсь

aladkoi Mar 29 at 18:47

Имеем годовую подписку на glm, но в разработке используем opus4.6. Разница в анализе кода с китайцем очень сильна. Glm в основном для небольших задач и rag.

Bardakan Mar 29 at 20:40

Насколько по вашему мнению glm 5 и 5.1 продвинулись в сравнении с 4.6? Когда я пробовал 4.6, то она была на уровне от силы claude haiku - вроде бы может решить многие задачи на проекте, но при этом часто путается, проект может не собираться из-за мелких ошибок.
А однажды glm 4.6 было сказано дописать изменения в существующий файл - она якобы не нашла его, но при этом стерла этот файл и полностью перезаписала своим содержимым, чего никогда не было с claude/kimi.

kaatula Apr 12 at 02:39

Ночью цены на планы обновили :-/

Мне щас пишут за один месяц

18 за Lite
72 за Pro
160 за Max

Yakwilik Apr 12 at 14:02

да, обновили(, но я вижу ты успел подписаться на Pro? Если подписался до изменения цены, то условия должны сохраниться

kaatula Apr 12 at 16:30

Да, хотел провести эксперимент, но он неожиданно вышел из контроля 🤣

Хочу заметить, что последние два дня очень большие ожидания, на больших контекстах полно быть 40 минут, может быть 80.

Мне кажется, народ ломанулся, и они экстренно подняли ценник. Чтобы уменьшить наплыв и нагрузку на вычислительные мощности.

Yakwilik Apr 12 at 16:31

Да, у меня такая же проблема, очень тормозить стал GLM, из-за этого теперь приходится пользоваться другой подпиской