А есть ли бесплатные API нейросетей? / Хабр

Третьего дня я решил сделать лид-магнит для своего Telegram-канала. Схема такая - бот собирает у пользователя текст, обрабатывает его нейросетью, выдает что-то полезное, и в конце просит подписаться на канал в обмен на результат. Aiogram 3, Python, VPS за 150 рублей - ничего необычного.

Встал первый вопрос - за что платить? Бот прототипный, аудитория на входе пока еще, собственно, не особо и понятно сколько человек. Платить $20 в месяц ради теста гипотезы - нет. Мы не ищем легких путей. Пошел разбираться, что вообще бесплатного есть.

Groq

console.groq.com

Groq работает на собственных чипах LPU, инференс - Llama 3.1 8B выдает около 2 000 токенов в секунду. API OpenAI-совместимый.

Есть вполне реальные лимиты бесплатного плана:

Chat / LLM:

Модель	Запросов/мин	Запросов/день	Токенов/мин	Токенов/день
llama-3.1-8b-instant	30	14 400	6 000	500 000
llama-3.3-70b-versatile	30	1 000	12 000	100 000
openai/gpt-oss-120b	30	1 000	8 000	200 000
openai/gpt-oss-20b	30	1 000	8 000	200 000
qwen/qwen3-32b	60	1 000	6 000	500 000
llama-4-scout-17b	30	1 000	30 000	500 000
groq/compound	30	250	70 000	без лимита
groq/compound-mini	30	250	70 000	без лимита

14 400 запросов в день от Llama 3.1 8B - это 10 запросов в минуту на протяжении 24 часов. Для прототипного бота с сотнями пользователей - более чем хватит.

Speech-to-Text (если бот принимает голосовые):

Модель	Запросов/мин	Запросов/день	Секунд аудио/день
whisper-large-v3	20	2 000	28 800
whisper-large-v3-turbo	20	2 000	28 800

Очень даже неплохо.

Text-to-Speech (если нужны голосовые ответы):

Модель	Запросов/мин	Запросов/день
orpheus-v1-english	10	100
orpheus-arabic-saudi	10	100

100 запросов в день по TTS - немного. Для статусных сообщений или приветствий хватит, для основного контента - нет.

OpenRouter - агрегатор с бесплатными моделями

openrouter.ai - регистрация, ключ, и сразу доступ к моделям.

Лимиты для бесплатных моделей:

20 запросов в минуту
50 запросов в день - без пополнения счета
1 000 запросов в день - после пополнения от $10 (деньги не тратятся на :free модели)

Актуальные бесплатные модели на май 2026, все по $0/1M токенов:

Модель	Контекст
qwen3-coder-480b-a35b	1 050K
kimi-k2.6	262K
gemma-4-26b-a4b	262K
llama-3.3-70b-instruct	131K
minimax-m2.5	205K
hermes-3-405b-instruct	131K
qwen3-next-80b-a3b-instruct	262K
lfm2.5-1.2b-thinking	33K

Есть еща такая штука openrouter/free. Он сам выбирает из доступных бесплатных ту, что поддерживает параметры запроса.

Google Gemini API - есть бесплатный тир, но с оговоркой

aistudio.google.com/apikey

Актуальные модели на май 2026 с бесплатным доступом:

gemini-2.5-flash
gemini-2.5-flash-lite
gemini-2.5-pro
gemini-3.1-flash-lite
gemini-3.5-flash

Важный момент: на бесплатном тире промпты и ответы используются для обучения Google. Если бот обрабатывает данные, которые пользователь не собирался никуда передавать - это нужно учитывать. На платном тире обучение отключается.

Cloudflare Workers AI - 10 000 Neurons в день

developers.cloudflare.com/workers-ai

Бесплатно: 10 000 Neurons в день (сбрасывается в 00:00 UTC).
Выше квоты: $0.011 за 1 000 Neurons - нужен Workers Paid план ($5/мес).

100+ моделей: Llama, Mistral, Qwen, Phi, Stable Diffusion и другие.

ElevenLabs - если нужен TTS

elevenlabs.io

Plan	Credits/мес	~Минут TTS
Free	10 000	~10 мин
Starter	30 000	~30 мин

10 000 кредитов в месяц - это примерно 10 минут синтезированной речи. Для приветствий или разовых сообщений в боте - хватит. Важно: Free план не дает коммерческой лицензии, только личное использование.

DeepL - если нужен перевод

deepl.com/en/checkout?is_api=true - ключ после регистрации.

Параметр	Значение
Символов/месяц	500 000
Изображения (beta)	Не тарифицируются
Word/Excel/PDF/PPT	до 10 MB и 500K символов

500K символов в месяц - это примерно 350 страниц A4.

OCR.space - если нужно распознавание текста с картинок

ocr.space/ocrapi/freekey

Параметр	Значение
Запросов/день	500 (по IP)
Engine 1/2 в месяц	25 000 конвертаций
Engine 3 в месяц	2 500 конвертаций

Engine 3 - рукописный текст, таблицы в Markdown, 200+ языков.

По итогу, основная модель у меня - llama-3.3-70b-versatile. 1 000 запросов в день для теста гипотезы очень даже хватает - пока при моем мелком потоке пользователей до потолка еще не добрался.

Если лимиты начнут упираться (очень на это надеюсь) - буду переходить на что-то уже более масштабируемое.

Надеюсь, Вам было полезно. Здоровья и хорошего настроения, дорогие читатели.