Orchestrateur de workflows open source où les pipelines sont définis comme des DAGs (Directed Acyclic Graphs) écrits en Python. Chaque nœud du DAG est un opérateur (BashOperator, PythonOperator, SparkSubmitOperator) et les arêtes définissent les dépendances d'exécution. Airflow gère la planification, l'exécution, le retry automatique et fournit une interface web pour monitorer l'état de chaque tâche. Son extensibilité via des providers (AWS, GCP, dbt, Spark) en fait le standard de facto du data engineering. Ses limites : les DAGs dynamiques sont complexes, et la scalabilité nécessite un executor Celery ou Kubernetes pour les charges élevées.