Pull to refresh
5
0
Сиплатов Кирилл @SiplatovKirill

User

Send message

3 способа запуска Spark в Kubernetes из Airflow

Level of difficultyEasy
Reading time7 min
Views4.1K

После того, как я научился запускать spark-submit с мастером в Kubernetes и даже получил ожидаемый результат, пришло время ставить мою задачу на расписание в Airflow. И тут встал вопрос, как это правильно делать. Во всемирной паутине предлагается несколько вариантов и мне было непонятно, какой из них стоит выбрать. Поэтому я попробовал некоторые из них и сейчас поделюсь полученным опытом.

Читать далее
Total votes 7: ↑6 and ↓1+7
Comments0

Airflow в Kubernetes. Часть 2

Level of difficultyMedium
Reading time7 min
Views5K

Приветствую!

В прошлой части мы развернули основные сервисы Airflow в k8s. В этот раз разберемся, как можно синхронизировать код DAD'ов с удаленным репозиторием, поймем, как перманентно сохранять логи, а также настроим HTTPS-соединение для UI!

Читать далее
Total votes 5: ↑4 and ↓1+6
Comments0

Airflow в Kubernetes. Часть 1

Level of difficultyMedium
Reading time10 min
Views10K

Приветствую!

На пути инженера данных часто встречаются задачи связанные с DevOps. Одна из таких - развернуть Airflow в Kubernetes кластере. Если до этого похожего опыта работы не было, то эта задача может показаться нетривиальной. Конечно, можно выполнить несколько команд из официального гайда, но если нужно будет что-то поправить, то без понимания, что происходит внутри, обойтись будет сложно.

Эта статья призвана  облегчить данную задачу. Она поможет тем, кто уже работал с Airflow, но еще не касался технологии Kubernetes. 

Читать далее
Total votes 8: ↑6 and ↓2+7
Comments8

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Engineer
Senior
SQL
Git
Python
PostgreSQL
English