
Комментарии 7
Стоимость , неоднозначный фактор. 50 тыс. запросов. Это не тот случай где 100 баксов за облако хуже чем 10 баксов на своём сервере.

Очень сомневаюсь, что 50к обращений в месяц дотянут до $100.
Учитывая, что сейчас справляется модель 0.5B, можно взять что-то вроде Google flash lite и будет даже дешевле VPS.
С другой стороны, отличная работа. Закиньте это все в WebLLM (а такая модель даже на телефоне запустится) и будет совсем бесплатно, просто вкладку открытой держать.
Демо и API не открываются
Чтобы повысить скорость обработки обращения да ещё чтобы сразу перевели на живого человека, нужно писать капсом и с восклицательными знаками
"баланс неправильный"{"intent":"service_request","category":"payment","urgency":"medium","sentiment":"neutral","entities":{},"route_to":"self_service"}
"БАЛАНС НЕПРАВИЛЬНЫЙ!!!"{"intent":"service_request","category":"tariff_change","urgency":"high","sentiment":"negative","entities":{},"route_to":"billing_dept"}
Как я сделал классификатор обращений для телеком-поддержки на своей LLM за $10/месяц