fettgesicht Sep 2 2025 at 13:08

OpenRouter: единый API для доступа к LLM

Easy

6 min

17K

Self Promo

Tutorial

Comments 24

MountainGoat Sep 2 2025 at 13:26

Всё хорошо, только оплата по токенам годится не для всех задач. Я тут решил попробовать на практике, как ИИ умеет программировать с нуля программу целиком. Написал ему задачу и какие технологии использовать. Результат не работал, хотя и был удобной заготовкой с которой начать. Вот только для его создания ИИ съел токенов на 1500 руб за 2 запроса.

Я давно уже использую ИИ вместо поисковика чтобы узнавать вещи типа "Ну так как приготовить кабачки?" И вот на одиночные вопросы ИИ отвечает хорошо и за копейки. А чтобы заставить его кодить, нужна подписка.

qoojoe Sep 2 2025 at 13:38

Кабачки лучше готовить через API Deepseek R1 (deepseek/deepseek-r1-0528:free). Бесплатно. Просто держите на счету OpenRouter 10$

CyberCarp Sep 3 2025 at 08:12

10 зелёных на счету нужны, потому что ротация может закинуть с бесплатных API моделей на платные?

pol_pot Sep 3 2025 at 08:19

Нет это просто защита от халявщиков. У тех кто никогда не ложил на счет 10 баксов лимит на бесплатные модели 50 запросов в день. У тех кто ложил 1000.

Зы халява там такая себе, бесплатные модели работают медленно и нестабильно, некоторые выставляют дополнительные нереальные лимиты, квен3-средний например не дает чаще чем раз в минуту.

SkylineXXX Sep 25 2025 at 21:58

Пример из омлетов мэйл ру:

Наложить в штаны.. . Класть что-то на стол...

qoojoe Sep 3 2025 at 10:50

Выше ответили +

https://openrouter.ai/docs/api-reference/limits

delfer Sep 3 2025 at 08:03

Вы явно что-то делали не так и не туда. У всех моделей есть лимит на размер запроса (контекст). Такое может быть только если взять самый дорогой Claude Opus 4.1 с контекстом 0.2 млн токенов и ценой $75/M output tokens. И тогда два самых больших запроса обойдутся в 30 баксов. Но это надо очень постараться, чтобы модель в ответ выдала 200к токенов. Да и вообще не надо писать код в Opus, если вы точно в этом не уверены.

Обычно с кодом хорошо справляются Claude Sonnet 4 ($15/M output tokens) или Gemini 2.5 Flash ($2.50/M output tokens).

Ну или у вас очень жадный посредник))

MountainGoat Sep 3 2025 at 08:07

Я использовал Qwen Coder 3 400B. Штука в том, что на один запрос от пользователя, расширение VSCode может генерировать неограниченное количество запросов к LLM. Там получилось по штук 20 запросов с дохрена токенов на входе.

delfer Sep 3 2025 at 10:19

Qwen3 Coder 480B A35B на OpenRouter стоит $0.80/M output tokens (input еще дешевле). Максимальный контекст 262,144 токенов. Даже по курсу 100р/$ (с учетом комиссий), 1500 - это $15. $15/0.8 = 18,75 млн токенов. 18,75/0,262144 ~ 70 сообщений максимально возможного размера, чего почти невозможно добиться.

Из моего опыта - на написание небольшого работающего приложения с нуля через Gemini Flash - нужно рублей 100, и это с учетом того, что он еще и отладит, исправит все ошибки.

eastywest Dec 13 2025 at 18:10

Qwen бесплатно дает 2000 запросов в день, число токенов не считается. Достаточно установить cli утилиту qwen-code, при запуске он предложит авторизоваться и дальше можно работать.

pol_pot Sep 2 2025 at 14:15

Эта проблема решается с помощью ProxyAPI — сервиса, который я использую для работы с моделями OpenAI, Anthropic и Google Gemini. Недавно они добавили поддержку OpenRouter в России с прозрачной фиксированной комиссией

А что там не так с ценами, в 3 раза дороже чем на опенроутере что ли.

whitehorsespb Sep 4 2025 at 06:55

Так и пост рекламный, если не заметили) Там партнёрская ссылка "ловко" вшита в урл)

utya Sep 2 2025 at 19:17

Парни подняли свой liteLLM норм)

Onyix67 Sep 2 2025 at 20:18

Не особо понимаю, зачем сейчас вообще нужен openrouter, если только обращение к разным моделям не встроенная функция твоей проги. Для мелких вопросов юзаешь приложение. Для вайб-кодинга есть AI Studio. Гемини сейчас с большинством задач справляется. Единственный минус - нужно самому постоянно копипастить код. Если все таки не можешь жить без того, чтобы модель все сама за тебя делала, можно вставить ключик ai studio в cursor.

Если хочешь использовать Клод, то опять таки лучше купить подписку на сайте и платить всего 20$ (да, с неудобствами), а не хз сколько по дорогому API. Тот же курсор жрет деньги как не в себя.

Если хочется юзать какие то более мелкие модели, то как по мне лучше купить подписку на Chutes, где ты будешь ограничен по количеству запросов, но сможешь отправлять объемные промпты не переживая, что запрос сожрет тебе пол баланса

И кстати пополнять openrouter ради бесплатного дипсика тоже как будто так себе. Там можно сойти с ума от количества перебоев и ошибок

starfair Sep 3 2025 at 05:53

Все вы верно рассуждаете, если бы сейчас на дворе был гипотетический 2020год, в котором уже есть все эти ИИ модели. Но сейчас 2025, и оплата сервисам AI за границами РФ весьма проблематична для большинства разработчиков внутри РФ. Поэтому и проще (для некоторых задач, само собой), оплатить с маржой посреднику, но за 1 минуту и отечественной картой. Плюс, некоторые сервисы просто блокируют доступ с ip внутри РФ. Не буду про политику, просто такова сейчас данность для подавляющего большинства программистов внутри страны

delfer Sep 3 2025 at 07:56

Я пишу код через Roo Code и через Qwen Code CLI, пишу небольшие приложения работающие с ИИ, и мне, естественно, нужен доступ к моделям через API.

Сначала я пользовался ProxyAPI - спасибо им, отличный сервис, главная фишка - можно оплачивать от юр. лица полностью в белую. Но для пет проектов слишком дорого.

Потом перешел на OpenRouter. У них цены как у официальных провайдеров, плюс комиссия. Оплата криптой - один раз разобраться, и дальше спокойно платить. Завести кошелек MetaMask, зарегистрироваться на Bybit, научится всем этим пользоваться, покупать крипту через P2P с карты "Желтого" или "Зеленого" банка. Кстати, проще всего и выгоднее использовать монету POL - с ней комиссия минимальная.

А теперь вообще перешел на neuroapi.host - есть вопросы к удобству, скорости, стабильности, зато цены НИЖЕ, чем у официальных провайдеров (личный опыт, не реклама).

Много букв получилось, надеюсь, кому-то будет полезно.

MountainGoat Sep 3 2025 at 08:12

Последний раз когда я видел у кого-то цены существенно ниже, чем у официальных провайдеров - оказалось, что они крутят свою модель на своём сервере, которая представляется и GPT и Claude и богом тоже.

delfer Sep 3 2025 at 09:30

Это где такое нашли?

MountainGoat Sep 3 2025 at 11:23

В /r/LocalLLM когда-то обсуждали, я не запоминал. Таких сервисов как дрожжей под сараем.

CyberCarp Sep 3 2025 at 08:16

Кто нибудь знает, почему в OpenRouter есть бесплатные модели, у них ведь и не только открытые модели такие, неужели тратят свои кровные на бесплатных юзеров? 🤔

Насколько они неограниченные, например, если собрать небольшой сервис на базе бесплатных моделей, могут ли они ограничить доступ к модели в какой-то момент? Инфы не нашёл по этому поводу в интернете.

pol_pot Sep 3 2025 at 08:33

Оригинальные провайдеры тоже раздают бесплатно, мистраль выдает 1млрд токенов в месяц на аккаунт например. Гугол поначалу давал еще больше, потом крантик прикрутил но всё ещё много дает. Есть и другие такие же "добрые".

Они рассчитывают что ты придешь, попробуешь, сделаешь свое приложение (вложишь в это значительные усилия) и наткнешься на бесплатные лимиты, и после этого платить начнешь что бы не переделывать.

У опенроутера халява работает нестабильно, раздают производители, там даже видно какие.

delfer Sep 3 2025 at 10:23

Вполне рабочая схема. Бесплатные лимиты вполне достаточны, чтобы потестировать модель, написать и отладить свое приложение с ней. А затем, если запускаешь что-то в продакшн (и зарабатываешь на этом), бесплатные модели с ограничениями тебе бесполезны, и ты платишь по полному прайсу. Так и окупается.

glassboll Sep 4 2025 at 05:47

А чем не устраивает сервис VseGPT.ru? Сервис разработан нашими ребятами, работает стабильно без замечаний и уже достаточно давно. Может работать с огромным количеством ИИ, более 120 моделей.Оплата без танцев с бубном и гораздо дешевле.

pol_pot Sep 4 2025 at 06:36

Там наценка 50%. Казах посередине за перевод фублей в сторону опенроутера берет не больше 20.