Обновить

Комментарии 19

Спасибо за аналитику, плюсанул от души! Недавно (сегодня) в связи с огромным зоопарком моделей, провайдеров, сложностью сетевых переплетений в стиле сексуальных девиаций "кто с кем, cuck и через что" и "выстрелом" (а по fuck'ту прогреву лаоваев) Xiaomi MiMo по якобы "дешевизне" я позаботился вопросом анализа этого всего бобра. И тут ваша статья, шикарно.

Один вопрос - кодинг агенты ведь не предназначены напрямую для OpenClaw? Короче, раньше был бесплатный тест-драйв от GenSee.ai - они тебе и сервер, и агента, и платную нейросети полностью бесплатно давали. Сейчас таких предложений забесплатно даже по триалу нет, а цены поднимаются выше $30/месяц. Почему? Ведь есть же бесплатные модели... Не очень понимаю. Мне бот нужен чисто для 10-20 нормисов в ватсаппе со средним IQ не выше 80, так что туда любая модель и сервер подойдут. Согласен платить $1-3 в месяц, сервер есть. А предложений на рынке почему-то нет...

Может проще кинуть на API Qwen/Deepseek/Mimo/Openrouter несколько долларов если запросов немного? Зачем смотрите сразу подписку, платите за запрос. Сравните цены, качество, сделайте выводы.

Бесплатные предложения есть, например, ollama cloud, Nvidia дают бесплатно API с лимитами.

Мне бот нужен чисто для 10-20 нормисов в ватсаппе со средним IQ не выше 80, так что туда любая модель и сервер подойдут

Откуда такая уверенность, что тупой энд-юзер -> низкие требования к модели?)

Если пользователь не сильно интеллектуален, значит, и запросы формулирует не факт, что качественно, что может требовать даже большей нагрузки на модель, чем общение с, например, выпускников физмат вуза, способным строго сформулировать задачу.

Кроме того, маленькие модели ох как любят галлюцинировать. Если там что-то типа техсаппорта, то можно внезапно наобещать этим нормисам слишком многого

А Trae и Qoder почему не сравнили?

О данных платформах ранее не слышал, но за наводку спасибо, попробую.

регистрируетесь на openrouter через почту на иностранном почтовике (не google!), пополняете криптой - сами или через барыг на ggsel.
на этом всё, юзайте аккакунт до исчерпания денег:) потом цикл повторить.

Тот самый OpenRouter, который не пинал только ленивый? Они лагают так, будто там на каждый запрос живой индиец отвечает.

Скорость зависит от модели. Бесплатные очень медленные, платные быстрые.

В целом к OpenRouter к меня нет претензий, за некоторыми нюансами, хороший поставщик, а для фалбэка так вообще идеальный, однако, выскажу непопулярное на Хабр мнение, но лично я к крипте после 22го года как-то с лёгким недоверием отношусь, поэтому и не упомянул в посте данный вариант. Но не спорю, что он тоже вполне рабочий.

У вайбкода два пути: Code-подписка и API

Скорее два стула, а не два пути )))

Один жидкий, а второй без бумажки.

Давно мечтал сделать такой звонкий и хлёсткий заголовок, а так-то согласен)

Ещё есть третий путь и он у каждого свой в виде on-premise моделей на домашнем железе, но тут потребуется это самое железо прикупить, а моделям более менее приличным железа надо много.

у Z.AI GLM бесплатный агентный режим через веб интерфейс, вполне себе неплохо работает и вроде без жёстких лимитов.

ну как так, все импортное. А если надо что-то конфиденциальное обработать на сервере в РФ? Яндекс становится все дороже с каждым днём((

Не всё импортное, я в список специально ещё Koda и Neuraldeep добавил, обе компании в России находятся, Koda делаете агента Kodacode, а у Neuraldeep on-premise модельки на своём железе.

И ещё очень хорошо и быстро работает "Gemini 3.1 flash" и "Gemini 3.1 flash Lite", у "Gemini 3.1 flash Lite" бесплатно 500 запросов в день, для нетяжёлого использования хватает.

Использую бесплатный лимит "Gemini 3.1 flash Lite" в OpenCode.
Как использовать бесплатный лимит Gemini в OpenCode, скоро выйдет статейка (на модерации).

Эх если у гугла не было запрета на доступ к моделям из России, то я бы их тоже попробовал, как-то слишком быстро определяют даже через туннели, не успевал распробовать, поэтому в ресёрч и не попали.

Практика из продакшена: 100+ сессий Claude Code в день на нескольких проектах.

API (через Claude Code CLI) выигрывает, когда нужна автоматизация: cron-задачи, пакетная обработка, CI/CD пайплайны. У меня 107 Telegram-топиков, каждый маршрутизирует задачи отдельной сессии Claude с собственным контекстом. Это невозможно через Code-подписку.

Подписка выигрывает для интерактивной разработки: когда сидишь перед экраном и итеративно отлаживаешь. Артефакты, предпросмотр, файловый менеджер.

Ключевое наблюдение: стоимость API непредсказуема. Один неудачный промпт с большим контекстом может стоить больше, чем дневной лимит подписки. Для команд без опыта оптимизации промптов подписка безопаснее.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации