simonovv18 мая в 11:56

Как мы за 54 дня собрали ИИ-хаб в мессенджере MAX. Часть 1 — обзор цикла

Средний

10 мин

Искусственный интеллектУправление продуктом * Высоконагруженные системы *

Кейс

Из песочницы

-5

Комментарии 12

KEugene 18 мая в 12:10

Хорошая попытка, но зря.

PechoraDev 18 мая в 12:16

Хоть бы текст статьи сами попробовали написать, а не через ИИ

simonovv 18 мая в 12:19

ИИ использовался только для рерайта и приведения простыни в более удобоваримый вид

PechoraDev 18 мая в 15:12

Все понимаю. У вас интересная идея, хороший продукт. Но извините - статья просто нечитаемая. Мне бы и хотелось прочесть вашу историю, но увы, стиль изложения отталкивает

Smartor 18 мая в 12:32

Очень интересная статья.
Скажите, а какие услуги у вас самые востребованные?

Вопрос про архитектуру.
Вы используете n8n. Как вы храните и синхронизируете контекст диалога между нодами? Используете ли вы внешнее хранилище (Redis/Postgres) для state-машины или полагаетесь на встроенные возможности n8n?

Вопрос по ошибкам.
Как реализован retry-механизм при падении внешних API (модели ИИ, Cobalt, RapidAPI)? Есть ли circuit breaker или fallback-логика на уровне воркфлоу?

Вопрос по нагрузкам.
Вы упоминаете 7 воркеров через Execute Workflow. Как распределяется нагрузка между ними? Есть ли очередь задач, и как обрабатываются ситуации, когда все воркеры заняты? Или это не реальный сценарий?:)

Лимит в 50К пользователей - что в данном случае бутылочное горлышко? n8n, Postgres, VPS, прокси, сеть? Планируете ли вы постепенную миграцию отдельных модулей в более быстрый "чистый" код?

В общем, у есть меня куча вопросов по каждому абзацу:)

simonovv 18 мая в 13:01

Redis для сию секундного контекста и балансировки, он для памяти пользует оперативку, Postgres для хранения истории диалогов и буфера фото ( долгая state-машина)

По retry: таймаут, доп попытки, в некоторых случаях резервные ветки и обязательно fallback - в любом случае не молчим. Так же обязательно смотрим, что именно говорят API, условно почему отпала генерация (не хватило времени, недоступна или запрещеный 18+ контент), и в зависимости от того, из-за чего отпало, думаем, возвращаем генерации на кошелек или нет.

Воркеров уже больше) Redis в n8n является и балансировщиком в режиме Queue Mode, выставляем concurrency согласно возможностей железа и получаем хорошую многопоточность (например ставим 8, и 1 воркер может одновременно работать до 8 раз при условии что главный main скинул с себя задачу). Так что очередь задач в n8n вполне рабочая штука.

По лимиту это я имел ввиду общую базу пользователей при 4000-7000 пользователей в день. В данном случае бутылочное горлышко именно n8n, вертикальный рост возможен до определенных мощностей, дальше можно двигаться в сторону k3s или более сложного k8s для горизонтального роста. По поводу чистого кода: тот же fast api сразу на чистом python, так как необходима атомарность платежей, по мере того, как будут отваливаться от перегруза те или иные воркеры, хотим выводить их в код.

По поводу вопросов по каждому абзацу: если местные старожилы дадут путь молодым и не заминусят, то с удовольствием распишу всё в цикле, тем более я никаких ссылок не прикрепляю и рекламу продукта делать не пытаюсь)

K0Jlya9 18 мая в 13:35

Где сам бот то.

simonovv 18 мая в 13:44

Сбросил в личку на тесты, чтобы тут не минусили

K0Jlya9 18 мая в 14:35

Бот неадекватно реагирует на сообщения от юзера. Например на 2 фотки сразу. Или на текст длиннее чем 4к символов (это тоже самое, два сообщения сразу, на которые надо реагировать как на одно).

Непонятно зачем он нужен людям, что бы получить доступ к нормальному джемини, копилоту итп даже впн не нужен, достаточно установить второй браузер - firefox и у него в настройках прописать dns типа такого https://dns.geohide.ru:444/dns-query

simonovv 18 мая в 15:48

Спасибо за дебаг, поправим. p.s. рядовой пользователь таких ботов не умеет в смену dns

K0Jlya9 18 мая в 22:24

Если юзер настолько "рядовой" что не может раздобыть впн то для него отлично подойдут братья по разуму от яндекса или сбера. В национальном мессенджере макс уже есть алиса с гигачадом. А еще они есть на своих страницах и отдельных приложениях, там у них нет идиотских ограничений телеграма, можно кидать по 2 картинки разом и тексты больше 4к.

mor-e 20 мая в 05:39

Очень круто! За такой срок и без опыта. Удачи в дальнейшей раскрутке,не обращайте внимание на хейт,как говорится: «п..ь - не мешки ворочать»

Вышлите ссылку на бота.

В максе такого не хватало,в телеге много,но с белыми списками уже надоело и не всегда получается перенастроить впн в рабочее состояние в нужный момент

Зарегистрируйтесь на Хабре, чтобы оставить комментарий