
Комментарии 23
UPD: для тех кто хочет протестировать сыча без его установки (т.к. в личку ему написать нельзя) добавил его в свой канал в телеграм в комментариях
UPD: для тех кто хочет протестировать сыча без его установки (т.к. в личку ему написать нельзя) добавил его в свой канал в телеграм в комментариях
А я вот прочитал внимательно:) Ты в команде git clone забыл свой репо указать. У тебя ссылка от AI осталась, который этот бот или писал или статью для тебя писал:)
Сделал аналогичного бота и уже больше года использую.
Первым делом пришлось добавить в него дополнительных провайдеров (groq, cerebras, mistral итп, они тоже раздают много халявы), гугол в одно лицо не справляется, на бесплатном тарифе часто выдает что то типа модель перегружена идите погуляйте пока, лимит на токены в минуту у него привязан к ип адресу, ну или хз почему обычная ротация не помогает и периодически получаешь ответ в духе превышен лимит на токены в минуту (250к).
Из-за того что провайдеров и моделей много разных пришлось сильно усложнить работу с памятью и файлами, нельзя просто так загрузить аудио в память потому что гугол - единственный кто настолько мультимодален, все остальные хорошо если хотя бы картинки понять могут.
У других моделей другая цензура, если джемини отказался отвечать на провокационный вопрос вместо него может ответить какая-нибудь ллама, и её ответ будет помещен в память джемини, после чего сам джемини будет думать что это он так ответил (а значит можно продолжать в том же духе :).
От родного поиска и калькулятора которые есть у джемини пришлось отказаться, точнее задвинуть их на второй план в резерв, тоже из за лимитов. Вместо них на первом месте стоит tavily и groq.
Сильно! А 250к в минуту – это сколько чатов одновременно? У меня примерно 5, в общей сложности человек на 100, и в лимиты в минуту я вообще ни разу не упирался. А вот модель перегружена, это в последнее время появилось, раньше такого у меня тоже не было
Немного. По идее должно хватать даже от одного ключа.
10 чатов в минуту по 3 запроса с каждого по 5000 токенов - всего 150т токенов в минуту.
Ключи для всех запросов всегда "свежие", отстоявшиеся больше минуты в запасе, в логах видно что если началось то все ключи отвечают так же, то есть это что то типа ограничения по ip а не по ключу.
зы у тебя в тексте неправильные цифры, такого уже давно нет (15 RPM / 1500 RPD)
Я использую бесплатные модели от OpenRouter.
Загоняешь 10$ им на счёт и получаешь 1000 запросов в день к бесплатным моделям: https://openrouter.ai/models?max_price=0
А у меня вопросик к старожилам - Gemini API пропускает запросы из России с аккаунта, который он считает российским?
У меня российский аккаунт Google, всё пропускает, но VPN обязателен, если спрашивать локально. А так сервер куплен в США и с моими API-ключами ноль проблем
Видимо нет. Попробовал зайти на https://aistudio.google.com/apikey и получил стандартную страницу, что сервис недоступен в моем регионе.
Бот написан на Node.js (нужна версия 18+).
Судя по обилию матов в переписке на скриншотах, там не только нода 18+ )))
У меня есть что-то подобное, но вид сбоку.
Я написал бота, который смотрит переписку в групповом рабочем чате, утром за прошедший день извлекает выданные задачи, выделяет из них ещё не выполненные и добавляет их в Telegram чек-лист с указанием инициалов исполнителя.
Итого в чате всегда свежий список задач к исполнению.
Ну и расшифровка голосовиков, ессно.
Решилась проблема "выдал поручение и забыл".
Сделано на n8n + telegram http-mtproto bridge + OpenRouter.
HTTP-Mtproto bridge нужен, потому что:
В telegram bot api пока что нет методов работы с чеклистами и приходится их создавать от имени юзербота.
n8n не умеет обращаться к mtproto, поэтому пришлось сделать микросервис, который принимает на вход payload по http и конвертирует его в команду mtproto. (github)
Опять лимит снизился, теперь дают всего 20 запросов в день на flash 2.5.
Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 20, model: gemini-2.5-flash\nPlease retry in 6.911354822s.', 'status': 'RESOURCE_EXHAUSTED'
{'quotaMetric': 'generativelanguage.googleapis.com/generate_content_free_tier_requests', 'quotaId': 'GenerateRequestsPerDayPerProjectPerModel-FreeTier', 'quotaDimensions': {'location': 'global', 'model': 'gemini-2.5-flash'}, 'quotaValue': '20'}]}
На gemma лимитов почти нет. Но качество у нее...

Вот за Gemmu спасибо, всегда смотрел в доках только Gemini API, а сейчас нашел и попробовал gemma-3-27b-it для Сыча конечно не подойдёт, но у меня есть ещё один проект, в который она идеально помещается, не такая быстрая как 2.5 Flash, но зато может принимать картинки на вход и с такими лимитами она просто идеальна. Сравнил скорости отклика на одинаковом запросе

Как будто бы хотелось видеть это в «Я пиарюсь» из за ограниченного входа в бота
Забрать бота с GitHub можно себе минут за 5 и сделать своего бота без каких-либо ограничений, я выложил все исходники, объяснил, как всё работает, запилил довольно подробную инструкцию, как это всё собрать. Но да, доступ к боту в личку я просто не могу дать всем, т.к. использую свои API ключи, тем более Google сегодня очень сильно порезали лимиты
Моему боту нельзя написать в личку, и нельзя добавить в свои группы и каналы, но смысл статьи был в том, что ты можешь его взять и сделать из него своего бота со своим характером и настройками и добавить его куда угодно
Голосового помощника бы такого...
Сыч: телеграм-бот, который помнит обиды и обходит лимиты Google Gemini