dbt Core est la version open source de dbt, installable via pip. Il couvre l'essentiel : modèles SQL modulaires, tests, documentation et lineage. Il s'intègre dans tout orchestrateur existant (Airflow, Dagster, Prefect) et ne nécessite aucune infrastructure propre. C'est le choix des équipes qui ont déjà un scheduler et veulent une solution gratuite et flexible.
Transformation SQL versionnée et testée
Les data engineers écrivent des transformations SQL en modèles dbt versionné sous Git, avec des tests automatiques (unicité, not-null, référentiels) à chaque exécution.
Documentation automatique du lineage
dbt génère automatiquement un DAG de dépendances entre modèles et une documentation interactive, permettant aux analystes de comprendre l'origine de chaque indicateur.
Environnements de développement isolés
Via les profils et les schemas personnalisés, chaque développeur dispose d'un environnement isolé pour tester ses transformations sans impacter la production.
Matérialisation incrémentielle des données
dbt gère les stratégies de matérialisation (table, vue, incrémental, ephemeral) pour optimiser les coûts de calcul sur des entrepôts comme BigQuery ou Snowflake.
✓ Points forts
✗ Limites
✓ Fait pour vous si…
Équipes avec un orchestrateur existant (Airflow, Dagster), contraintes budgétaires, ou souhait de garder le contrôle total sur l'infrastructure.
✗ Pas fait pour vous si…
Équipes sans orchestrateur ni expertise DevOps qui veulent se concentrer sur le SQL, ou petites équipes sans ressources ops.
dbt Fundamentals
Formation officielledbt Learn
Complete dbt Bootcamp: Zero to Hero
MOOCUdemy
Introduction to dbt
MOOCDataCamp