Data Universe
Newsletter
AccueilOutilsDagster
Dagster logo

Dagster

Orchestration

L'orchestrateur orienté assets pour les équipes data modernes

Tarif

Open source gratuit / Cloud Solo à partir de 10$/mois (+ crédits usage)

Open sourceFree tierIntermédiaire

Dagster introduit le concept d'orchestration orientée assets (tables, fichiers, modèles) plutôt que tâches. Offre une meilleure observabilité du lineage et permet de raisonner sur l'état des données, pas seulement sur l'exécution des tâches.

Asset-based orchestration
Software-defined assets
Asset checks (validation)
Sensors et schedules
Partitions temporelles natives
Dagster UI (très moderne)
Intégration dbt, Spark, Airbyte native
Dagster+ (Cloud)
1

Orchestration orientée assets data

Dagster modélise les pipelines autour des assets (tables, modèles ML, fichiers) plutôt que des tâches, offrant une vision naturelle du lineage et de la fraîcheur des données.

2

Intégration native avec dbt et Spark

Dagster s'intègre nativement avec dbt, Spark et Great Expectations pour orchestrer des pipelines data avec qualité et transformation dans un workflow unifié.

3

Observabilité et gestion des dépendances

L'UI Dagster affiche le graphe de dépendances des assets, leur statut de fraîcheur et l'historique des matérialisations pour faciliter le débogage.

4

Backfill et matérialisation partielle

Dagster permet de re-matérialiser sélectivement des assets en amont ou en aval d'un problème détecté, sans rejouer l'intégralité du pipeline.

✓ Points forts

+Paradigme asset-centric très puissant
+Interface la plus moderne des trois (Airflow/Prefect/Dagster)
+Intégration dbt excellente
+Observabilité et lineage des données natifs
+Typage fort des inputs/outputs

✗ Limites

Courbe d'apprentissage conceptuelle (changer de paradigme)
Communauté plus petite qu'Airflow
Moins d'opérateurs disponibles
Moins adapté aux pipelines purement task-based

✓ Fait pour vous si…

Équipes data engineering modernes qui pensent en termes d'assets (tables, fichiers, modèles). Projets dbt + Spark.

✗ Pas fait pour vous si…

Orchestration d'événements purement opérationnels. Équipes déjà fortement investies Airflow.

Dagster Documentation & Tutorials

Documentation

Dagster

Gratuit

Dagster University (Essentials)

Formation officielle

Dagster

Gratuit

Modern Data Orchestration with Dagster

MOOC

Udemy

~15€
open-sourceorchestrationpythonassets