🏗️Exemple concret
Banque avec 12 systèmes sources : le Hub_Client contient uniquement la clé métier (numéro client) et la date de chargement. Le Satellite_Client_Identite contient les attributs (nom, prénom, adresse), versionnés par date. Quand le CRM change son format d'adresse, seul le Satellite est modifié. Aucun impact sur les Hubs ni les 200 Links existants.
∑ Concept clé
Hub = {hash_key, business_key, load_date, record_source}. Satellite = {hub_hash_key, load_date, end_date, attributes...}. Link = {link_hash_key, hub1_hash_key, hub2_hash_key, load_date}.
🎯Quand l'utiliser ?
✓Data Warehouses devant absorber de nombreux systèmes sources hétérogènes
✓Environnements réglementés nécessitant un audit trail complet
✓Projets agiles où le modèle va évoluer souvent
✅ Avantages
+Chargements parallèles et hautement performants
+Audit trail natif (date, source pour chaque ligne)
+Résistant aux changements de schéma (ajout de Satellites sans impact)
⚠️ Limites
−Complexité : 3-5x plus de tables qu'un schéma en étoile
−Requêtes plus complexes (nombreuses jointures)
−Courbe d'apprentissage importante pour les équipes
🛠️ Outils principaux
dbt (très compatible avec Data Vault via dbtvault)
WhereScape
TimeXtender
Snowflake (performances adaptées)
Data EngineeringModélisationData WarehouseAuditAgilité