🏗️Exemple concret
Data platform d'une banque sur Azure : Bronze = tables sources copiées depuis les systèmes (transactions, contrats, clients) au format brut dans ADLS Gen2. Silver = tables normalisées, jointures résolues, données nettoyées. Gold = modèles agrégés (exposition risque par client, scoring journalier, reporting réglementaire). dbt orchestre les 3 couches.
∑ Concept clé
Bronze (Raw) : COPY AS-IS depuis source, pas de transformation. Silver (Curated) : déduplication, typage, nettoyage, enrichissement. Gold (Serving) : agrégats, métriques métier, modèles optimisés pour la consommation.
🎯Quand l'utiliser ?
✓Toute architecture Lakehouse (Databricks, Fabric, Iceberg+Spark)
✓Organisation des tables dans un Data Lake
✓Séparation claire entre ingestion, transformation et serving
✅ Avantages
+Reproductibilité : le Gold est toujours recalculable depuis le Bronze
+Isolation : une erreur en Silver n'affecte pas le Bronze
+Debugging facilité : on peut rejouer n'importe quelle couche
⚠️ Limites
−Multiplication des tables (3x le nombre de tables)
−Latence additionnelle (3 couches à traverser)
−Définition des frontières Silver/Gold parfois floue selon les équipes
🛠️ Outils principaux
Databricks (Lakehouse natif)
Microsoft Fabric (OneLake + Medallion)
dbt (Silver → Gold)
Apache Spark (Bronze → Silver)
Data EngineeringArchitectureLakehouseDatabricksData Lake