Комментарии 25
Любопытно, а в России есть провайдеры которые на свои серверы ставят китайские LLM и продают инференс ? Непонятно почему некоторые наши компании продают доступ к китайским LLM на серверах в США ? Неужели это выгоднее ? или есть какие то скрытые расходы ?
Посмотрите цены Яндекса и у вас все вопросы отпадут:)
cloud.ru ставит и продаёт, сейчас glm-4.7 и какой то qwen в бесплатном доступе
Так ведь есть гигачат, яндекс, конторы разные по типу ai.wormsoft.ru , сейчас это только становится актуальным и люди только начинают делать свои варианты
Лимиты на Plus просели ощутимо.
Насколько просели? Какие сейчас вообще лимиты? У меня клод за 20$ и его хватает от 30 минут и до 1.5 часов. И только 7-8 сессий в неделю. Что с codex? Стоит ли он 20$?
Свежая инфа по Plus: только что добавил логгирование в один MCP - штук 10 файлов поменял, раз 30 тулзы вызвал. Модели - 5.4 и 5.3-codex: расход - 85% 5-часовых лимитов и 13% недельных.
Я уже второй месяц codex 5.4 xhigh не могу выбрать больше 10%-20%, пишу ТЗ час-два, потом 2-3 промта 15 минут и все готово, полчаса-час коде ревью и тестирование. Потом новое тз 2-3 часа и лимиты опять сбросились до 100%. До сих пор не понимаю как выбрать все лимиты. Мультиагетность мне не нужна потому что делаю ревью всему коду иначе все агенты будут меня ждать.
Используйте agent harness типа get-shit-done, они голодные до лимитов.
Спасибо, поизучаю.
Сейчас я в IntelliJ справа окно запускаю агента, слева окно сразу делаю code review. Я так и не понимаю как работать в Codex отдельном приложении, ведь после генерации кода по нему нужно навигироваться и смотреть diff оп гиту + сразу из IDE запускаю приложение на симуляторе для тестирования.
Скрытый текст

Я не работал с приложениями на iOS, но приложения на Android Claude Code прекрасно умеет самостоятельно гонять и тестировать в эмуляторе, например. Что касается "смотреть diff по гиту", то такие штуки как gsd как раз сделаны для того, чтобы навалить в процесс вайбкодинга планировщиков и проверяльщиков - возможно не так часто придется перепроверять вручную. Плюс, то что можно делать сразу параллельно в несколько агентов - он сам найдет и сделает.
IntelliJ у агента все права и возможности, он мне тоже запускает тесты на симуляторе. Но визуально я сам всё потом смотрю, просто это быстрее чем он сам будет запускать и валидировать логику по UI. У меня тз такого вида:
Создал фичу по шаблону из skill/feature-template
Напиши юнит тесты
Запусти юниты тесты на маке
запусти юнит тесты на iphone
запусти юнит тесты на ipad
пока он пишет код и гоняет тесты в правом окне IDE, в левом я сразу делаю code review, агентам не разрешаю код ревью, потому что их код не всегда удовлетворяем моим стандартам.
С мультиагентностью теряешь фокус, падает общее качество кода и сильнее устаешь из-за постоянного изменения фокуса.
Но опять, это только работает для меня. У всех свои привычки. В этом режиме получается код за который не стыдно и пишется довольно быстро.
Ну, посмотрите, пробуйте - если вы уже используете skill\feature-template, то вы уже на полпути там, gsd добавит только планирование и проверки.
проверки
Это я сам )) даже top модель claude иногда пишет странный (но рабочий) код, который отходит от базовых стандартов (лишние аллокации памяти, лишние трансформации строк и списков). В общем буду спать плохо если не увижу хотя бы поверхностно что там написано, не зря же я учил сложности кода O(n)/O(1), наконец эти знания пригодились)
Там последние 2 недели они как раз из за бага в codex обнуляли лимиты чуть ли не раз в пару дней, сейчас мало того что халяву прикрыли, так еще и лимиты порезали.
Ну делайте более сложные задачи, правки багов, исследования кода на многие миллионы строк кода. Я порой параллельно запускаю задачи.
исследования кода на многие миллионы строк кода
А зачем это делать, если для задачи в скилл задачи прописаны глянуть тут сервис, тут бд, тут 3 файла и на их базе написать задачу, зачем весь код анализировать. Я не участвую в конкурсе кто больше бессмысленно токенов сожжет.
Ну делайте более сложные задачи
От задачи это почти не зависит, чем сложнее задача тем просто дольше буду писать промпт, например промпт пишу 2 дня потому что бегаю за дизайнерами, менеджерами, аналитиками, коллегами чтобы написать подробный ТЗ на пару страниц для ИИ, потом gpt его реализует за час-два + потом ручная проверка и отправка в QA. То есть ИИ работает за 2 дня ровно один-два раза (не считая короткие консультации когда составляю ТЗ, но они довольно дешево выходят) и сразу всё готово.
Менее чем за час выбрал 5 часовой лимит. В прошлые выходные за 3 часа активной работы с кодом у меня от 5 часового лимита еще даже что то оставалось. Сейчас лимит сгорает на глазах так же как и недельный. Конкретных цифр лимитов никто не знает.
Зависит от многих факторов, на несложных тасках лимитов хватает норм, на прошлой же неделе были объемные задачи, 5-ти часовой лимит улетал за 45 минут, недельный лимит съел за три дня
Советую ещё проверить скорость работы, он у меня по-тихому подрубил fast у которого потребление usage x2
На днях присоединился к Плюс, но на лимиты пока не жалуюсь, тк не с чем ее сравнить.
Заметил только большую разницу по трате между 5.4 и 5.3-codex. Поэтому сижу на 5.3 а последнюю модель использую для особых случаев
На "простые запросы" продолжит отвечать, только оплатить из России всё ещё не возможно, хорошо, что я минимум пользуюсь из России 😝(да как и многие впрочем...) и почти закончил
Отправил промпт
30 минут ждал ответ
5 часовой лимит испарился за 1 промпт
Ответа я так и не получил
r.i.p codex

OpenAI запустила подписку Pro за $100 — и урезала Codex у Plus