Pull to refresh
1
5
Dmitrii Tretiakov @tretiakov_dm

User

Send message

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow

Level of difficultyMedium
Reading time7 min
Views1.9K

Всем привет! Меня зовут Дмитрий Третьяков, я ML Engineer в компании «Лента». Мы регулярно запускаем PySpark-приложения в Kubernetes-кластере, используя Airflow. Этот процесс важен для нашей ежедневной работы с данными, но в какой-то момент мы столкнулись с тем, что стандартный подход через SparkKubernetesOperator стал сдерживать развитие: не хватало гибкости, возникали сложности в сопровождении и процесс настройки был излишне сложным для разработчиков.

Читать далее

Information

Rating
1,203-rd
Registered
Activity