В основном mlflow используется для трекинга метаданных непосредственно самой модели (параметры, метрики, артефакты), в данном случае у вас это тренировка и тестирование. На счет трекинга самого конвеера не думали "пока" в этом направлении. А какой профит в трекине загрузки и обработки данных? Валидация и качество или может ещё что то?
Для связки входов/выходов этапов пайплайна в Airflow для этого есть XCOM (думаю это очевидно).
В основном mlflow используется для трекинга метаданных непосредственно самой модели (параметры, метрики, артефакты), в данном случае у вас это тренировка и тестирование. На счет трекинга самого конвеера не думали "пока" в этом направлении. А какой профит в трекине загрузки и обработки данных? Валидация и качество или может ещё что то?
Для связки входов/выходов этапов пайплайна в Airflow для этого есть XCOM (думаю это очевидно).