Search
Write a publication
Pull to refresh
1
0
Dmitrii Tretiakov @tretiakov_dm

User

Send message

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow

Level of difficultyMedium
Reading time7 min
Views2.2K

Всем привет! Меня зовут Дмитрий Третьяков, я ML Engineer в компании «Лента». Мы регулярно запускаем PySpark-приложения в Kubernetes-кластере, используя Airflow. Этот процесс важен для нашей ежедневной работы с данными, но в какой-то момент мы столкнулись с тем, что стандартный подход через SparkKubernetesOperator стал сдерживать развитие: не хватало гибкости, возникали сложности в сопровождении и процесс настройки был излишне сложным для разработчиков.

Читать далее

Information

Rating
2,013-th
Registered
Activity