VetaOne5 дек 2025 в 16:30

Сыч: телеграм-бот, который помнит обиды и обходит лимиты Google Gemini

Простой

7 мин

13K

Node.JS * JavaScript * Искусственный интеллектDIY или Сделай сам

Кейс

Сезон ИИ в разработке

Комментарии 23

Закреплённые комментарии

VetaOne 5 дек 2025 в 17:21

UPD: для тех кто хочет протестировать сыча без его установки (т.к. в личку ему написать нельзя) добавил его в свой канал в телеграм в комментариях

VetaOne 5 дек 2025 в 17:21

DooKoo2 5 дек 2025 в 18:29

А я вот прочитал внимательно:) Ты в команде git clone забыл свой репо указать. У тебя ссылка от AI осталась, который этот бот или писал или статью для тебя писал:)

dominus_augustus 5 дек 2025 в 18:43

Штирлиц еще никогда не был так близок к провалу

VetaOne 5 дек 2025 в 19:21

Спасибо поправлю, да код полностью написан с помощью, Gemini 3 pro. Как и все остальные мои проекты

K0Jlya9 6 дек 2025 в 01:16

Сделал аналогичного бота и уже больше года использую.

Первым делом пришлось добавить в него дополнительных провайдеров (groq, cerebras, mistral итп, они тоже раздают много халявы), гугол в одно лицо не справляется, на бесплатном тарифе часто выдает что то типа модель перегружена идите погуляйте пока, лимит на токены в минуту у него привязан к ип адресу, ну или хз почему обычная ротация не помогает и периодически получаешь ответ в духе превышен лимит на токены в минуту (250к).

Из-за того что провайдеров и моделей много разных пришлось сильно усложнить работу с памятью и файлами, нельзя просто так загрузить аудио в память потому что гугол - единственный кто настолько мультимодален, все остальные хорошо если хотя бы картинки понять могут.

У других моделей другая цензура, если джемини отказался отвечать на провокационный вопрос вместо него может ответить какая-нибудь ллама, и её ответ будет помещен в память джемини, после чего сам джемини будет думать что это он так ответил (а значит можно продолжать в том же духе :).

От родного поиска и калькулятора которые есть у джемини пришлось отказаться, точнее задвинуть их на второй план в резерв, тоже из за лимитов. Вместо них на первом месте стоит tavily и groq.

VetaOne 6 дек 2025 в 03:10

Сильно! А 250к в минуту – это сколько чатов одновременно? У меня примерно 5, в общей сложности человек на 100, и в лимиты в минуту я вообще ни разу не упирался. А вот модель перегружена, это в последнее время появилось, раньше такого у меня тоже не было

K0Jlya9 6 дек 2025 в 07:54

Немного. По идее должно хватать даже от одного ключа.

10 чатов в минуту по 3 запроса с каждого по 5000 токенов - всего 150т токенов в минуту.

Ключи для всех запросов всегда "свежие", отстоявшиеся больше минуты в запасе, в логах видно что если началось то все ключи отвечают так же, то есть это что то типа ограничения по ip а не по ключу.

зы у тебя в тексте неправильные цифры, такого уже давно нет (15 RPM / 1500 RPD)

VetaOne 6 дек 2025 в 08:21

Понял, спасибо, тоже поправил. Я давно смотрел в документации лимиты и помню, что было в районе 1500. Сейчас перепроверил: для Gemini 2.5 Flash RPM 10 и RPD 250. Неплохо так порезали

leshchenko 6 дек 2025 в 09:48

Я использую бесплатные модели от OpenRouter.

Загоняешь 10$ им на счёт и получаешь 1000 запросов в день к бесплатным моделям: https://openrouter.ai/models?max_price=0

А у меня вопросик к старожилам - Gemini API пропускает запросы из России с аккаунта, который он считает российским?

VetaOne 6 дек 2025 в 09:51

У меня российский аккаунт Google, всё пропускает, но VPN обязателен, если спрашивать локально. А так сервер куплен в США и с моими API-ключами ноль проблем

leshchenko 6 дек 2025 в 09:58

Видимо нет. Попробовал зайти на https://aistudio.google.com/apikey и получил стандартную страницу, что сервис недоступен в моем регионе.

VetaOne 6 дек 2025 в 10:04

Попробуй на VPN выставить страну США, 99% пропустит

debagger 6 дек 2025 в 01:40

Бот написан на Node.js (нужна версия 18+).

Судя по обилию матов в переписке на скриншотах, там не только нода 18+ )))

VetaOne 6 дек 2025 в 03:01

Да, это забавно. Но это второй бот пришел в комменты и там понеслось )), так то он редко на мат переходит первый

leshchenko 6 дек 2025 в 09:56

У меня есть что-то подобное, но вид сбоку.

Я написал бота, который смотрит переписку в групповом рабочем чате, утром за прошедший день извлекает выданные задачи, выделяет из них ещё не выполненные и добавляет их в Telegram чек-лист с указанием инициалов исполнителя.

Итого в чате всегда свежий список задач к исполнению.

Ну и расшифровка голосовиков, ессно.

Решилась проблема "выдал поручение и забыл".

Сделано на n8n + telegram http-mtproto bridge + OpenRouter.

HTTP-Mtproto bridge нужен, потому что:

В telegram bot api пока что нет методов работы с чеклистами и приходится их создавать от имени юзербота.
n8n не умеет обращаться к mtproto, поэтому пришлось сделать микросервис, который принимает на вход payload по http и конвертирует его в команду mtproto. (github)

K0Jlya9 7 дек 2025 в 00:36

Опять лимит снизился, теперь дают всего 20 запросов в день на flash 2.5.

Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 20, model: gemini-2.5-flash\nPlease retry in 6.911354822s.', 'status': 'RESOURCE_EXHAUSTED'

{'quotaMetric': 'generativelanguage.googleapis.com/generate_content_free_tier_requests', 'quotaId': 'GenerateRequestsPerDayPerProjectPerModel-FreeTier', 'quotaDimensions': {'location': 'global', 'model': 'gemini-2.5-flash'}, 'quotaValue': '20'}]}

VetaOne 7 дек 2025 в 04:53

Да, сегодня с утра проснулся, и в чатиках куча недовольных, у Google всё хорошо стало, закручивают гайки ((

K0Jlya9 7 дек 2025 в 02:48

На gemma лимитов почти нет. Но качество у нее...

VetaOne 7 дек 2025 в 12:03

Вот за Gemmu спасибо, всегда смотрел в доках только Gemini API, а сейчас нашел и попробовал gemma-3-27b-it для Сыча конечно не подойдёт, но у меня есть ещё один проект, в который она идеально помещается, не такая быстрая как 2.5 Flash, но зато может принимать картинки на вход и с такими лимитами она просто идеальна. Сравнил скорости отклика на одинаковом запросе

stasikoff 7 дек 2025 в 12:19

Как будто бы хотелось видеть это в «Я пиарюсь» из за ограниченного входа в бота

VetaOne 7 дек 2025 в 14:49

Забрать бота с GitHub можно себе минут за 5 и сделать своего бота без каких-либо ограничений, я выложил все исходники, объяснил, как всё работает, запилил довольно подробную инструкцию, как это всё собрать. Но да, доступ к боту в личку я просто не могу дать всем, т.к. использую свои API ключи, тем более Google сегодня очень сильно порезали лимиты

VetaOne 7 дек 2025 в 14:54

Моему боту нельзя написать в личку, и нельзя добавить в свои группы и каналы, но смысл статьи был в том, что ты можешь его взять и сделать из него своего бота со своим характером и настройками и добавить его куда угодно

uniq 11 дек 2025 в 10:43

Голосового помощника бы такого...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий