Обновить
0
Александр Сесоров@Salexoid

AI QA Engineer

2
Подписчики
Отправить сообщение

Больше никаких «черных ящиков»: мониторим и оцениваем качество LLM-приложений с Langfuse

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели13K

Представьте: вы ведете автомобиль, а на приборной панели нет ни спидометра, ни датчика топлива, ни каких-либо показателей вообще. Ни-че-го. В принципе ехать можно, но вы не знаете, какая у вас скорость, сколько бензина и есть ли с авто какие-то проблемы. Примерно так выглядит работа с LLM-приложением без инструментов мониторинга: система вроде бы и функционирует, но о ее внутреннем состоянии можно только догадываться. 

Меня зовут Александр Сесоров, я работаю инженером по тестированию в YADRO. Занимаюсь задачами автоматизации оценки производительности, точности и эффективности моделей на различных конфигурациях. Сегодня проведу краткий экскурс в инструментарий Langfuse и на примерах из практики покажу, как превратить оценку качества LLM-приложения из гадания в систематизированный и прозрачный сбор метрик на всех этапах.

Читать далее

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность

Специализация

Test Automation Engineer
Middle
Python
CI/CD
Pytest
Deep Learning
Neural networks
Git
Docker
Linux
C++
Game Development