Pull to refresh
0
0
Александр Сесоров@Salexoid

AI QA Engineer

Send message

Больше никаких «черных ящиков»: мониторим и оцениваем качество LLM-приложений с Langfuse

Level of difficultyEasy
Reading time9 min
Reach and readers11K

Представьте: вы ведете автомобиль, а на приборной панели нет ни спидометра, ни датчика топлива, ни каких-либо показателей вообще. Ни-че-го. В принципе ехать можно, но вы не знаете, какая у вас скорость, сколько бензина и есть ли с авто какие-то проблемы. Примерно так выглядит работа с LLM-приложением без инструментов мониторинга: система вроде бы и функционирует, но о ее внутреннем состоянии можно только догадываться. 

Меня зовут Александр Сесоров, я работаю инженером по тестированию в YADRO. Занимаюсь задачами автоматизации оценки производительности, точности и эффективности моделей на различных конфигурациях. Сегодня проведу краткий экскурс в инструментарий Langfuse и на примерах из практики покажу, как превратить оценку качества LLM-приложения из гадания в систематизированный и прозрачный сбор метрик на всех этапах.

Читать далее

Information

Rating
Does not participate
Works in
Registered
Activity

Specialization

Инженер по автоматизации тестирования
Средний
Python
CI/CD
Pytest
Deep Learning
Нейронные сети
Git
Docker
Linux
C++
Разработка игр