Я думаю для агентских систем применение крупных моделей нецелесообразно в большинстве случаев - экономика решений не сойдется. Гораздо производительнее и стабильнее использовать ансамбль SLM, обученных для решения узких задач в рамках микросервиса, а LLM - точечно, под широкие задачи.
Облачные технологии в контексте агентских AI-систем