ArthurEx29 мая в 21:08

А есть ли бесплатные API нейросетей?

3 мин

39K

Python * Разработка под e-commerce * Искусственный интеллект

Кейс

+80

Комментарии 66

Maxim_Q 29 мая в 21:59

Какие из бесплатных нейросетей самые умные и дают хорошие ответы, а какие потупее? Что вы протестировали и какие выводы сделали?

KREC_fuse 1 июн в 05:06

Перевожу:всё исследование, которое ты тут провел - не достаточно для меня. Пока я продолжаю лежать на диване, проведи перекрестные тесты и сообщи мне результат по наилучшей выборке их этих моделей.

Reiske 1 июн в 05:07

Посмотри minstral, на gpt4, клбчи бесплатные, работает без впн

FreeTheOS 1 июн в 05:07

у mistral в groq 30 запросов в минуту и 14 400 в день, отвечает конечно не как клод, но нормально, использовал для юзербота в телеграмм, выполняет такую задачу вполне хорошо, тулзы вызывает тоже нормально

Dreams_and_magic 29 мая в 22:09

Список бесплатных моделей в openrouter у вас не адекватен. Не всё, на что написано free, то реально работает. Нужно проверять через playground. И сделать fallback цепочку из бесплатных РАБОТАЮЩИХ моделей, в конце freerouter модель и в самом конце платная. Список перепроверять не реже 1 раза в месяц.

Вообще, у всех бесплатных лимитов и у всех услуг у всех провайдеров всегда есть ограничение, в которые вы сразу упрётесь при масштабировании - количество запросов в секунду. Это специально сделано, чтобы не использовали как халяву для энтерпрайза. Поэтому бесплатное можно обычно использовать либо при прототипировании, либо примерно при 5-10 активных юзерах:)

Для прототипа с использованием openrouter можно подключить очень дешёвые платные модели, типа https://openrouter.ai/tencent/hy3-preview и https://openrouter.ai/deepseek/deepseek-v4-flash.

Про Google Gemini API - в списке есть например Gemini 2.5 Flash это бесплатно 20 запросов в день, ну это ерунда. Нормальный лимит лишь у моделей Gemma 4 31B и Gemma 4 26B по 1500 запросов в день, но я бы не назвал эти модели пригодными для чего-то серьёзного.

Лимитов бесплатного Cloudflare Workers AI не хватит почти ни на что.

Ещё есть бесплатные лимиты у:
Cerebras
Mistral
Китайские провайдеры типа Cherry (но там ХЗ как платить)

Про голос на русском языке: бесплатные лимиты TTS/STT есть у SaluteSpeech.

ЗЫ Ещё есть бесплатные сервисы погоды, медицинских диагнозов и лекарств, курсы валют... :)

A-Dobrii 29 мая в 22:19

Интересно а если делать не переключение если не работает, а просто постоянно ратирова запросы в разные модели?

Тогда лимиты будут уходить "плавнее", возможно вообще с лимитами не сталкнешся .

Идея да

Dreams_and_magic 29 мая в 22:45

Лимиты есть либо в пределах всего сервиса (как в openrouter), либо в пределах модели (как у Mistral). В первом случае вы просто не пройдёте через бутылочное горлышко, во втором будете параллельно сжигать лимиты при том же бутылочном горлышке. Поэтому используется последовательный перебор при отказах.

A-Dobrii 30 мая в 06:15

А где я сказал делать ротатор в пределах одного сервиса?

AlexTest 30 мая в 11:07

А если например старый добрый "мультиаккаунтинг" - распределять нагрузку на несколько бесплатных аккаунтов, насколько серьезные барьеры могут быть в этом направлении ?

riky 30 мая в 21:47

Год, два назад это бы хорошо работало. Но сейчас все личных агентов ставят и все бесплатные сервисы абузят, поэтому лимиты везде низкие. Пробовал мультиакк недавно на cerebras (с прокси конечно) на запросы с маленьким контекстом вроде нормально работает, но при реальной нагрузке типа openclaw все сразу падает, отвечает ошибками. Пока пришёл к тому что проще дешёвые модели использовать. За небольшую плату работает без проблем. Полгода назад у Gemini были просто царские бесплатные лимиты. Можно было десятки долларов в день с акка экономить. А сейчас везде очень слабые нейронки и лимиты смешные. Хотя если задача прям очень простая то пойдёт. До сих пор сервис автоответов на отзывы на гроке бесплатном работает.

Ratenti 29 мая в 23:23

Да, нужны статьи на эти темы, верная мысль

ЗЫ Ещё есть бесплатные сервисы погоды, медицинских диагнозов и лекарств, курсы валют... :)

Dreams_and_magic 29 мая в 23:39

ага, чтобы минусов наставили))

Neyroskuf 29 мая в 23:41

Я, прошу прощения заранее, возможно, я чего-то не понял, но, по моему скромному мнению, тут человек описывал возможность реализации, а не качественное сравнение моделей или их реальной адаптации под задачу. Рискну предположить, что было бы гораздо полезнее в контектсе самой темы - добавить недостающие элементы. А не иронизировать по поводу сервисов погоды, медицинских диагнозов и лекарств.

Никто не оспаривает вашу компетентность, но, возможно, нам, как скромным читателям, было бы в разы интереснее узнать про доступы, скажем, к тому жеж мистралу и церебрасу в бесплатной реализации, а не в накидывании говна на вентилятор.

Dreams_and_magic 30 мая в 00:11

Возможность реализации напрямую связана с работоспособностью. То, что не работает, то не реализуемо. Просто список free моделей в openrouter не работает, потому что работает по факту штук пять моделей, и их список постоянно меняется - бесплатный сыр не навсегда (за исключением моделей Nemotron, но они слабые и медленные).

"Рискну предположить, что было бы гораздо полезнее в контектсе самой темы - добавить недостающие элементы. " - я их и добавил в комментарии.

"А не иронизировать по поводу сервисов погоды, медицинских диагнозов и лекарств. " - почему иронизировать? Эти сервисы реально есть и работают в моём телеграм боте.

"было бы в разы интереснее узнать про доступы, скажем, к тому жеж мистралу и церебрасу в бесплатной реализации " - там всё как обычно, ключ + формат вызова как в openai, т.е. https://api.cerebras.ai/v1/chat/completions и аналогично у Мистраль.

Самое интересное у Мистраль - возможность использовать их недавно вышедшую плотную версию mistral-medium-3-5, там лимиты в free tier:

mistral-medium-3-5

Tokens per Minute

50 000

Tokens per Month

4 000 000

Requests per Second

1.00

Бутылочное горлышко - 1 запрос в секунду.

У Cеrebras главное ограничение - маленькое окно данных (почти у всех моделей 130тыс токенов). Но и для этого есть применения. Например, я его использую в телеграм боте в инлайн-режиме, там получаются короткие ответы со скоростью 3000 токенов в секунду, т.е. мгновенно.

"а не в накидывании говна на вентилятор " - чойта сразу говна? у меня вполне конструктивная критика проблемных мест :)

SensDj 30 мая в 05:05

Openrouter прислал письмо что с Россией больше не работает, дал мне 30 дней дотратить мои 20 баксов

amatoravg 30 мая в 06:14

А если под квн заходить?

SensDj 30 мая в 06:29

Логинился через гмэйл без впн. По аккаунту решение ими уже принято, проверять поздно. Вот жду может на Хабре кто-то напишет как лучше действовать на будущее... возможно нужен аккаунт зарегенный в другой стране

AlchemistDark 7 июн в 08:30

Я Openrouter пользуюсь из РФ через VPN. Аккаунт зимой создал привязав на gmail

MountainGoat 30 мая в 05:12

Постоянно мухлевать какие-то списки, и чтобы всё то и дело отваливалось, чтобы не потратить 5 долларов – это диагноз.

A-Dobrii 30 мая в 06:17

Ну представь у тебя подключено 100 разный сервисов, на каждом по 100 аккаунтов, ....

DanielKross 30 мая в 08:53

А накуа? Многовато для пет проектов. А если не пет проекты, для коммерции нужна стабильность, а не искать бесплатные, отваливающиеся сервисы. Для пет проектов наверное проще тогда купить что-то типа 3090, за 600-700 евро и баловаться сколько влезет.

Dreams_and_magic 30 мая в 11:58

Представьте, что вас забанят за такие фокусы:)

riky 30 мая в 21:52

В этом и Проблема бесплатных лимитов, даже если 100 чел так сделает то знатно абузит сервисы и поэтому реальные лимиты заметно ниже и по количеству запросов и по длине контекста никто уже не гарантирует бесплатные лимиты

Bunyaz39 30 мая в 09:31

Пока трафика нет, жалко даже эти пять долларов отдавать. Но когда появляются реальные пользователи, проще заплатить и спать спокойно

Geologist5330 30 мая в 05:34

И сделать fallback цепочку из бесплатных РАБОТАЮЩИХ моделей

Звучит так, словно это может прилично увеличить время до ответа. Но для прототипов и пет-проектов, наверное, норм.

Bunyaz39 30 мая в 09:34

В принципе для прототипа сойдет любой костыль, лишь бы как-то работал. Когда появятся деньги, просто выкинешь этот мусор и подключишь стабильную платную апишку

Dreams_and_magic 30 мая в 10:59

Там отказ от генерации приходит за миллисекунды.

"Но для прототипов и пет-проектов, наверное, норм. " - проблема не в скоростях, а в ограничениях. В любом случае на бесплатных тарифах всё медленнее и ненадёжнее, чем на платных, и модели как правило доступны только слабые.

NeoCode2 29 мая в 23:50

Интересно есть ли бесплатный API у обычного Grok и ChatGPT? А то так получается что доступ к ним из РФ заблокирован с их стороны, и если к тому что заблокировано со стороны РФ есть куча других способов получить доступ, то вот к этим чатам - только vps с vless+xhttp, который работает все хуже. Но ведь для чатботов трафик минимальный. И возникает мысль - а что если работать через ssh? Или вообще по email? Написать клиента какого-нибудь...

Или нужен "безголовый" браузер на vps, на котором есть DOM и JS но нет рендеринга, и парсить ответы таким способом?

K0Jlya9 30 мая в 01:45

Grok и ChatGPT

Эти двое доступны без впна через сервисы для обхода геоблокировок. Типа такого https://dns.geohide.ru:8443/

Топовый раздаватель API халявы сейчас - гугол с gemini, там моделька 3.1 лайт дает 500 запросов в сутки на рыло, более чем достаточно для 1 человека.

Следующий за ним - мистраль. У него из интересного есть ocr, недоделанный как и всё от этого провайдера. Качество низкое но зато много.

Грок и церебрас почти ничего полезного не дают, виспер только и компаунд(встроенный поиск и лимиты приличные), остальные модели там слишком сильно зарезаны или устарели и неактуальны для нас(ттс не поддерживает русский).

Гемма от гугла с одной стороны по всем бенчмаркам очень хороша, и почти без лимитов, а с другой гугол ее как то испортил на своем бесплатном сервисе, системный промпт она не поддерживает, инструменты и json по-моему тоже, не помню, но в целом она какая то несъедобная там.

Опенроутер никогда халявы нормальной не давал, даже с 10 баксовым аккаунтом.

Dreams_and_magic 30 мая в 11:54

В смысле не давал, 1000 запросов В ДЕНЬ на бесплатные модели.

K0Jlya9 30 мая в 12:07

В смысле приличных бесплатных моделей хер да маленько и они огорожены больше чем другие, например не дают сделать больше чем 1 запрос в минуту, или отвечают со скоростью черепахи, или у них отключена поддержка джейсонов или еще какая-нибудь хрень не дающая нормально использовать.

Dreams_and_magic 30 мая в 13:35

Когда промо-период у новых моделей, то всё летает:) А, так конечно, это всё чисто лишь бы что-нибудь было:) Любая халява это по сути реклама.

Для бесплатного кодинга также можно использовать бесплатные модели в opencode, там они условно безлимитны и промо новых моделей периодически бывают. Gemini 3.1 Flash Lite слабовата в кодинге, главный плюс контент это 1М контент и поддержка картинок, имхо.

dartraiden 30 мая в 20:08

Для бесплатного кодинга ещё можно прикрутить бесплатный DeepSeek

nidalee 30 мая в 19:14

Там почти у каждой "бесплатной" модели свои лимиты. Потыкал пару недель назад эту бесплатность, понял, что городить огород с перебор моделей того не стоит.

gmetan 1 июн в 05:06

сервисы для обхода геоблокировок

Насколько они безопасны? Они же по сути MITM, т.е. ты доверяешь им трафик. На чем основано доверие этим анонимным и бесплатным сервисам, которые нельзя проверить и нет результатов независимой проверки признанным квалифицированным аудитором? даже если трафик зашифрован (https), то теоретически можно его расшифровать.

baytyone 1 июн в 05:12

Нужны голосовые ответы на русском языке. Может быть знаете, и сможете подсказать что-то?

K0Jlya9 1 июн в 05:15

https://github.com/rany2/edge-tts

Тут есть небольшое дополнение, можно выкачать сайт и посмотреть исходники и ресурсы https://edgetts.github.io/

den_rad 30 мая в 06:47

Если пользоваться платным ChatGPT, доступ к нему можно получить через OpenRouter + BYOK – добавляете свой ключ ChatGPT в OpenRouter и ходите на OpenRouter, тратя кредиты ChatGPT

Dreams_and_magic 30 мая в 19:15

Да, но есть нюанс - BYOK в OpenRouter можно использовать только API-ключи с оплатой по использованию (pay-as-you-go), но не подписки типа Claude Pro и т.п.

Apogee 30 мая в 05:10

Есть бесплатные glm 4.5 и 4.7 в api z.ai

https://docs.z.ai/guides/overview/pricing

GLM-4.7-Flash

d3d14 30 мая в 06:20

Зачем вообще так остервенело все собирают подписчиков в свои каналы? На фоне спада в ИТ, монетизируют их?

A-Dobrii 30 мая в 06:26

Это просто мода такая.

Если вы не помните когда то предлагали всем подписаться на список рассылки, чуть позже в свой блог, потом зайдите в мой Твиттер,и теперь канал.

А вообще - способ расширения личного графа общения, не обязательно прямая монетизация.

Bunyaz39 30 мая в 09:38

Аудитория сейчас самый понятный актив. Рекламу продать или свой продукт запустить всегда проще, когда есть лояльная база читателей

RulenBagdasis 30 мая в 07:10

Наверняка, есть! Главное, помнить, что если ты что-то используешь и не платишь за это, ты не клиент, ты товар…

surefire 30 мая в 07:23

И также помнить, что если ты что-то используешь и платишь за это, ты не только клиент, но еще и товар.

LinkToOS 30 мая в 09:52

если ты что-то используешь и не платишь за это, ты не клиент, ты товар

“Если ты не платишь, это не значит что тебя не используют.”
А товаром ты быть не можешь. Информация о тебе может быть товаром.

hachucha 1 июн в 13:15

Человек не может быть только субъектом, в каких-то случаях он еще и объект. Поэтому его и называют здесь товаром. Человеком легко манипулировать, если есть достаточно мощности воздействия на него и информации о нем. Рыночная экономика является рыночной только для проигравших, кому продают сказки о том, что много людей не могут договориться. Пока нет гос.финансирования информационных технологий в замен на полную открытость механизмов, ты даже не поймешь, как и где именно тебя мониторят и заставляют "принимать" то или иное решение.

devoln 30 мая в 08:13

По моему опыту и на моих двух задачах Mistral, а конкретно ministral-8b/14b рулят с большим отрывом. Ни одна модель без размышлений с Cloudflare, даже в разы более дорогих (проверял вплоть ло Llama 70b), не смогла даже приблизиться к результатам ministral-8b, не говоря уже о 14b. Просто не слушаются и всё, нарушая правила и запреты, даже описанные несколько раз в промпте разными словами. Я долго искал фолбек, но не нашёл ничего подходящего. Придётся использовать разных провайдеров с той же ministral, где она редко встречается, дороже официальной и только платная или хостить самому.

Не знаю, может это эффект того, что я с самого начала работал с Mistral и подгонял промпт под уже устаревшую pixtral-12b - видимо предка ministral, или это объективно такие хорошие модели под мою задачу, для которой крайне важно следование инструкциям.

ququnta 30 мая в 08:32

а чем gpt-oss не подходит? Министраль (девстраль-мини) немного туповата. Насчёт кодинга не знаю, но от реального мира она оторвана, что плохо.

Единственное, гпт очень любит форматирование в маркдауне и ЛаТеКс в формулах. И болтлив. Но кодит вроде хорошо

devoln 30 мая в 09:07

ministral не для кодинга, а решение узкой задачи моего сервиса, под которую я подгоняю промпт. Одна задача - сочинить сцены по желаниям пользователя, с его участием, учитывая ограничения. Вторая - описать физические параметры тела пользователя по фотке, не описывая одежду, фон и другие предметы. Из всего этого потом генерируются фотки.

GPT-OSS - рассуждающая модель, которая сожрёт в разы больше токенов, чего мне не надо. Мне нужен исполнитель, который слушается, а не думает сам.

Для кодинга у меня платный Codex и иногда триал Windsurf.

nidalee 30 мая в 19:15

gpt-oss-120b в баш скрипте на 30 строк умудряется пролюбить перенос строки, оно для кодинга антиполезно.

Bunyaz39 30 мая в 09:28

Для локального тестирования гипотез это еще имеет смысл. Сразу заносить бабки в каждый новый сервис тоже не очень рационально, особенно когда половина из них отвалится через месяц

DamirMur 30 мая в 13:16

Там ещё фишка, если начал кодить на одной модели, то лучше продолжать кодить только на моделях этого семейства. Переключение на модели другого семейства, может похерить весь проект.

kuza2000 30 мая в 17:59

Не совсем понял мысль. Что значит "начал кодить на одной модели"? А если я начал кодить сам, мне теперь до конца жизни кодить на этой модели?)

VKAT0N 13 июн в 07:04

У вайбкодеров уже свой кодекс плохих примет сформировался)

vagon333 30 мая в 15:42

Пользуюсь Groq последние два года.
Очень доволен.
Ежемесячные счета смешные, не превышали 4 доллара при очень интенсивной работе. Сейчас полтора доллара, после переноса некоторых моделей на домашний Inference.

Pavlp59 30 мая в 19:54

А что насчет российских сервисов? Gigachat, Алиса, у них есть халява?

Spencer098765 30 мая в 20:53

У вас завидное чувство юмора )

AlchemistDark 7 июн в 10:20

Есть у Koda

TimurZhoraev 30 мая в 20:56

Если раньше охотились за битками то теперь будут за API ключами для токенов

Aelliari 30 мая в 21:38

Там вроде ещё «Невидиа» давала бесплатный доступ к нейронками для «не РФ», но нужна была иностранная симка для регистрации. Не знаю, правда, есть ли там геоблок по ip

Dreams_and_magic 30 мая в 21:43

Там одноразовый небольшой лимит.

voronkovich 30 мая в 22:07

В самом простом случае, вместо API можно использовать CLI, передавая запрос через stdin:

echo 'You are helpful coding assistant... Your task is ...' | gemini

# Или так
gemini -p 'Generate commit message...'

Обычно, при использовании CLI (Gemini/Qwen) количество доступных бесплатных запросов больше чем в API (у Gemini 1000 RPD). Возможно для совсем простого чатбота этого хватит.

Я недавно сделал Bash-утилиту для генерации Git-коммитов, в которой вместо API используются именно CLI (gemini, qwen, aichat и т.д.). Так как коммитов каждый день я создаю много, я надеялся таким образом сэкономить деньги и не тратить оплаченные токены на такую простую задачу. Результат оказался не очень, особенно с моделями Groq: каждое второе сообщение приходилось редактировать через git commit --amend. Поэтому не стоит сильно надеяться на Groq. Запросы он обрабатывает быстро, но модели у него “тупые”.

В качестве источника для поиска “бесплатных” моделей могу посоветовать models.dev, там есть несколько провайдеров с free tier. Например, aihubmix.com.

Честно говоря, не очень понимаю, чем ваш чатбот может быть полезен для пользователей. Сейчас полно браузерных чатов (да хотя бы и GigaChat или z.ai, без всякой регистрации). Зачем кому-то идти за этим в телеграмм и подписываться на ваш канал?

K0Jlya9 30 мая в 23:48

Кстати о полезных сервисах. У гугла в апи есть моделька для tts, и ее вполне реально абузить, надо только раздобыть сотни аккаунтов Ж)

Озвучил ей книжку

https://cloud.mail.ru/public/BR1r/SJc26FrDs

Nx_anykey_dev 1 июн в 05:07

Z.ai - GLM 4.7 flash бесплатная, по api

gggo 2 июн в 06:55

Схема такая - бот собирает у пользователя текст, обрабатывает его нейросетью, выдает что-то полезное, и в конце просит подписаться на канал в обмен на результат

С каких пор в РФ запрещены чаты нейросетей по типу kimi, deepseek? Почему вы считаете что мусор (коим являются модели, предоставляемые по бесплатному апи) смогут дать хоть какой-то приемлемый результат?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий