Детерминистический аудит-слой для LLM-агентов — открытое демо
Мультиагентные системы уже работают в финтехе и госсекторе — но их решения остаются чёрным ящиком. Я собрала eval pipeline, который аудирует поведение агентов в реальном времени:
→ Нарушения KYC/AML правил → Зацикливание в цепочках решений → Галлюцинированные обоснования
Архитектура: LangGraph агент → структурированные логи → метрики (consistency, anomaly detection) → audit report с PASS/FAIL по каждой цепочке.
Работает на любой модели через LiteLLM — меняешь модель одной строкой в config.yaml. API-ключ не нужен, есть рабочий Jupyter notebook.
Ориентировано на финтех и госсектор: EU AI Act, ФСТЭК.
Демо: github.com/DariRinch/dcl-eval-pipeline-demo
