All streams
Search
Write a publication
Pull to refresh

Comments 23

Всё хорошо, только оплата по токенам годится не для всех задач. Я тут решил попробовать на практике, как ИИ умеет программировать с нуля программу целиком. Написал ему задачу и какие технологии использовать. Результат не работал, хотя и был удобной заготовкой с которой начать. Вот только для его создания ИИ съел токенов на 1500 руб за 2 запроса.

Я давно уже использую ИИ вместо поисковика чтобы узнавать вещи типа "Ну так как приготовить кабачки?" И вот на одиночные вопросы ИИ отвечает хорошо и за копейки. А чтобы заставить его кодить, нужна подписка.

Кабачки лучше готовить через API Deepseek R1 (deepseek/deepseek-r1-0528:free). Бесплатно. Просто держите на счету OpenRouter 10$

10 зелёных на счету нужны, потому что ротация может закинуть с бесплатных API моделей на платные?

Нет это просто защита от халявщиков. У тех кто никогда не ложил на счет 10 баксов лимит на бесплатные модели 50 запросов в день. У тех кто ложил 1000.

Зы халява там такая себе, бесплатные модели работают медленно и нестабильно, некоторые выставляют дополнительные нереальные лимиты, квен3-средний например не дает чаще чем раз в минуту.

Пример из омлетов мэйл ру:

Наложить в штаны.. . Класть что-то на стол...

Вы явно что-то делали не так и не туда. У всех моделей есть лимит на размер запроса (контекст). Такое может быть только если взять самый дорогой Claude Opus 4.1 с контекстом 0.2 млн токенов и ценой $75/M output tokens. И тогда два самых больших запроса обойдутся в 30 баксов. Но это надо очень постараться, чтобы модель в ответ выдала 200к токенов. Да и вообще не надо писать код в Opus, если вы точно в этом не уверены.

Обычно с кодом хорошо справляются Claude Sonnet 4 ($15/M output tokens) или Gemini 2.5 Flash ($2.50/M output tokens).

Ну или у вас очень жадный посредник))

Я использовал Qwen Coder 3 400B. Штука в том, что на один запрос от пользователя, расширение VSCode может генерировать неограниченное количество запросов к LLM. Там получилось по штук 20 запросов с дохрена токенов на входе.

Qwen3 Coder 480B A35B на OpenRouter стоит $0.80/M output tokens (input еще дешевле). Максимальный контекст 262,144 токенов. Даже по курсу 100р/$ (с учетом комиссий), 1500 - это $15. $15/0.8 = 18,75 млн токенов. 18,75/0,262144 ~ 70 сообщений максимально возможного размера, чего почти невозможно добиться.

Из моего опыта - на написание небольшого работающего приложения с нуля через Gemini Flash - нужно рублей 100, и это с учетом того, что он еще и отладит, исправит все ошибки.

Эта проблема решается с помощью ProxyAPI — сервиса, который я использую для работы с моделями OpenAI, Anthropic и Google Gemini. Недавно они добавили поддержку OpenRouter в России с прозрачной фиксированной комиссией

А что там не так с ценами, в 3 раза дороже чем на опенроутере что ли.

Так и пост рекламный, если не заметили) Там партнёрская ссылка "ловко" вшита в урл)

Парни подняли свой liteLLM норм)

Не особо понимаю, зачем сейчас вообще нужен openrouter, если только обращение к разным моделям не встроенная функция твоей проги. Для мелких вопросов юзаешь приложение. Для вайб-кодинга есть AI Studio. Гемини сейчас с большинством задач справляется. Единственный минус - нужно самому постоянно копипастить код. Если все таки не можешь жить без того, чтобы модель все сама за тебя делала, можно вставить ключик ai studio в cursor.

Если хочешь использовать Клод, то опять таки лучше купить подписку на сайте и платить всего 20$ (да, с неудобствами), а не хз сколько по дорогому API. Тот же курсор жрет деньги как не в себя.

Если хочется юзать какие то более мелкие модели, то как по мне лучше купить подписку на Chutes, где ты будешь ограничен по количеству запросов, но сможешь отправлять объемные промпты не переживая, что запрос сожрет тебе пол баланса

И кстати пополнять openrouter ради бесплатного дипсика тоже как будто так себе. Там можно сойти с ума от количества перебоев и ошибок

Все вы верно рассуждаете, если бы сейчас на дворе был гипотетический 2020год, в котором уже есть все эти ИИ модели. Но сейчас 2025, и оплата сервисам AI за границами РФ весьма проблематична для большинства разработчиков внутри РФ. Поэтому и проще (для некоторых задач, само собой), оплатить с маржой посреднику, но за 1 минуту и отечественной картой. Плюс, некоторые сервисы просто блокируют доступ с ip внутри РФ. Не буду про политику, просто такова сейчас данность для подавляющего большинства программистов внутри страны

Я пишу код через Roo Code и через Qwen Code CLI, пишу небольшие приложения работающие с ИИ, и мне, естественно, нужен доступ к моделям через API.

Сначала я пользовался ProxyAPI - спасибо им, отличный сервис, главная фишка - можно оплачивать от юр. лица полностью в белую. Но для пет проектов слишком дорого.

Потом перешел на OpenRouter. У них цены как у официальных провайдеров, плюс комиссия. Оплата криптой - один раз разобраться, и дальше спокойно платить. Завести кошелек MetaMask, зарегистрироваться на Bybit, научится всем этим пользоваться, покупать крипту через P2P с карты "Желтого" или "Зеленого" банка. Кстати, проще всего и выгоднее использовать монету POL - с ней комиссия минимальная.

А теперь вообще перешел на neuroapi.host - есть вопросы к удобству, скорости, стабильности, зато цены НИЖЕ, чем у официальных провайдеров (личный опыт, не реклама).

Много букв получилось, надеюсь, кому-то будет полезно.

Последний раз когда я видел у кого-то цены существенно ниже, чем у официальных провайдеров - оказалось, что они крутят свою модель на своём сервере, которая представляется и GPT и Claude и богом тоже.

Это где такое нашли?

В /r/LocalLLM когда-то обсуждали, я не запоминал. Таких сервисов как дрожжей под сараем.

Кто нибудь знает, почему в OpenRouter есть бесплатные модели, у них ведь и не только открытые модели такие, неужели тратят свои кровные на бесплатных юзеров? 🤔

Насколько они неограниченные, например, если собрать небольшой сервис на базе бесплатных моделей, могут ли они ограничить доступ к модели в какой-то момент? Инфы не нашёл по этому поводу в интернете.

Оригинальные провайдеры тоже раздают бесплатно, мистраль выдает 1млрд токенов в месяц на аккаунт например. Гугол поначалу давал еще больше, потом крантик прикрутил но всё ещё много дает. Есть и другие такие же "добрые".

Они рассчитывают что ты придешь, попробуешь, сделаешь свое приложение (вложишь в это значительные усилия) и наткнешься на бесплатные лимиты, и после этого платить начнешь что бы не переделывать.

У опенроутера халява работает нестабильно, раздают производители, там даже видно какие.

Вполне рабочая схема. Бесплатные лимиты вполне достаточны, чтобы потестировать модель, написать и отладить свое приложение с ней. А затем, если запускаешь что-то в продакшн (и зарабатываешь на этом), бесплатные модели с ограничениями тебе бесполезны, и ты платишь по полному прайсу. Так и окупается.

А чем не устраивает сервис VseGPT.ru? Сервис разработан нашими ребятами, работает стабильно без замечаний и уже достаточно давно. Может работать с огромным количеством ИИ, более 120 моделей.Оплата без танцев с бубном и гораздо дешевле.

Там наценка 50%. Казах посередине за перевод фублей в сторону опенроутера берет не больше 20.

Sign up to leave a comment.

Articles