Обновить

Как мы за 54 дня собрали ИИ-хаб в мессенджере MAX. Часть 1 — обзор цикла

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели7.2K
Всего голосов 15: ↑6 и ↓9-2
Комментарии11

Комментарии 11

Хорошая попытка, но зря.

Хоть бы текст статьи сами попробовали написать, а не через ИИ

ИИ использовался только для рерайта и приведения простыни в более удобоваримый вид

Все понимаю. У вас интересная идея, хороший продукт. Но извините - статья просто нечитаемая. Мне бы и хотелось прочесть вашу историю, но увы, стиль изложения отталкивает

Очень интересная статья.
Скажите, а какие услуги у вас самые востребованные?

Вопрос про архитектуру.
Вы используете n8n. Как вы храните и синхронизируете контекст диалога между нодами? Используете ли вы внешнее хранилище (Redis/Postgres) для state-машины или полагаетесь на встроенные возможности n8n?

Вопрос по ошибкам.
Как реализован retry-механизм при падении внешних API (модели ИИ, Cobalt, RapidAPI)? Есть ли circuit breaker или fallback-логика на уровне воркфлоу?

Вопрос по нагрузкам.
Вы упоминаете 7 воркеров через Execute Workflow. Как распределяется нагрузка между ними? Есть ли очередь задач, и как обрабатываются ситуации, когда все воркеры заняты? Или это не реальный сценарий?:)

Лимит в 50К пользователей - что в данном случае бутылочное горлышко? n8n, Postgres, VPS, прокси, сеть? Планируете ли вы постепенную миграцию отдельных модулей в более быстрый "чистый" код?

В общем, у есть меня куча вопросов по каждому абзацу:)

Redis для сию секундного контекста и балансировки, он для памяти пользует оперативку, Postgres для хранения истории диалогов и буфера фото ( долгая state-машина)

По retry: таймаут, доп попытки, в некоторых случаях резервные ветки и обязательно fallback - в любом случае не молчим. Так же обязательно смотрим, что именно говорят API, условно почему отпала генерация (не хватило времени, недоступна или запрещеный 18+ контент), и в зависимости от того, из-за чего отпало, думаем, возвращаем генерации на кошелек или нет.

Воркеров уже больше) Redis в n8n является и балансировщиком в режиме Queue Mode, выставляем concurrency согласно возможностей железа и получаем хорошую многопоточность (например ставим 8, и 1 воркер может одновременно работать до 8 раз при условии что главный main скинул с себя задачу). Так что очередь задач в n8n вполне рабочая штука.

По лимиту это я имел ввиду общую базу пользователей при 4000-7000 пользователей в день. В данном случае бутылочное горлышко именно n8n, вертикальный рост возможен до определенных мощностей, дальше можно двигаться в сторону k3s или более сложного k8s для горизонтального роста. По поводу чистого кода: тот же fast api сразу на чистом python, так как необходима атомарность платежей, по мере того, как будут отваливаться от перегруза те или иные воркеры, хотим выводить их в код.

По поводу вопросов по каждому абзацу: если местные старожилы дадут путь молодым и не заминусят, то с удовольствием распишу всё в цикле, тем более я никаких ссылок не прикрепляю и рекламу продукта делать не пытаюсь)

Где сам бот то.

Сбросил в личку на тесты, чтобы тут не минусили

Бот неадекватно реагирует на сообщения от юзера. Например на 2 фотки сразу. Или на текст длиннее чем 4к символов (это тоже самое, два сообщения сразу, на которые надо реагировать как на одно).

Непонятно зачем он нужен людям, что бы получить доступ к нормальному джемини, копилоту итп даже впн не нужен, достаточно установить второй браузер - firefox и у него в настройках прописать dns типа такого https://dns.geohide.ru:444/dns-query

Спасибо за дебаг, поправим. p.s. рядовой пользователь таких ботов не умеет в смену dns

Если юзер настолько "рядовой" что не может раздобыть впн то для него отлично подойдут братья по разуму от яндекса или сбера. В национальном мессенджере макс уже есть алиса с гигачадом. А еще они есть на своих страницах и отдельных приложениях, там у них нет идиотских ограничений телеграма, можно кидать по 2 картинки разом и тексты больше 4к.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации