Pull to refresh
3
Игорь Сериков@eager_igor

User

Send message

Airflow TaskFlow API: внутреннее устройство современного способа писать DAG‑и

Level of difficultyMedium
Reading time11 min
Reach and readers8.2K

Немного погрузимся во внутреннее устройство Apache Airflow и разберёмся, что на самом деле происходит за красивым синтаксисом TaskFlow API. Посмотрим, как работают декораторы @task и @dag, каким образом обычные Python‑функции превращаются в задачи Airflow и за счёт какой «магии» строится граф зависимостей. А заодно напишем собственный мини‑пример, чтобы лучше понять архитектурные идеи, на которых построен современный Airflow.

Заглянем под капот Airflow TaskFlow API

Декларативный Data Pipeline

Level of difficultyMedium
Reading time8 min
Reach and readers6.9K

В статье разберём, как построить декларативный data pipeline на Python: от базовых идей до реализации собственного мини-фреймворка с шагами, контекстом и SQL-интеграцией.

Декларативный data pipeline

Information

Rating
Does not participate
Registered
Activity

Specialization

Инженер данных
Средний