Обновить

Комментарии 1

Согласен с Вами! На практике собирать такие пайплайны удобнее всего на базе фреймворков вроде RAGAS. Они уже имеют под капотом математически выверенные промпты для метрик вроде Faithfulness и Answer Relevance.

Ну и не стоит забывать про безопасность: в этот же пайплайн автоматизированных оценок критически важно встраивать проверку на Prompt Injection и джейлбрейки.

Потому что агент может отвечать очень эмпатично и по формату, но при этом радостно сливать базу данных.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации