🏗️Exemple concret
Chez Zalando (pionnier du Data Mesh) : l'équipe 'Commandes' possède et publie le dataset 'orders' avec une SLA de qualité garantie (fraîcheur < 1h, 0 valeurs nulles sur order_id). L'équipe 'Recommandations' consomme ce dataset sans dépendre d'une équipe data centrale. Chacun est autonome.
∑ Concept clé
4 principes : 1) Ownership décentralisé par domaine, 2) Données comme produit (qualité, SLA, documentation), 3) Infrastructure self-service, 4) Gouvernance fédérée (standards communs)
🎯Quand l'utiliser ?
✓Grandes organisations avec plusieurs domaines métier
✓Quand l'équipe data centrale est un bottleneck
✓Quand on veut scaler la culture data dans toute l'entreprise
✅ Avantages
+Scalabilité : pas de goulot d'étranglement central
+Responsabilisation des équipes métier
+Meilleure qualité (les producteurs sont aussi les premiers utilisateurs)
⚠️ Limites
−Complexe à mettre en Å“uvre (nécessite une vraie maturité data)
−Risque de silos si la gouvernance fédérée est mal faite
−Investissement infrastructure et formation important
🛠️ Outils principaux
Databricks (Unity Catalog)
AWS Lake Formation
Google Dataplex
Atlan
dbt
ArchitectureGouvernanceOrganisationData Platform