Data Universe
Newsletter
GlossaireDData Lineage
Gouvernance

Data Lineage

Définition

Traçabilité complète du cycle de vie d'une donnée : de sa source d'origine (système OLTP, fichier, API) à travers toutes ses transformations (jointures, agrégations, enrichissements) jusqu'à ses destinations finales (dashboards, modèles ML, exports). Le lineage permet de répondre à deux questions critiques : impact analysis (si je modifie cette table source, quels pipelines et rapports sont affectés ?) et root cause analysis (d'où vient cette anomalie dans ce KPI ?). En conformité réglementaire, le lineage documente la provenance des données utilisées dans les modèles de scoring, exigé par RGPD et l'AI Act. Des outils comme OpenLineage standardisent le format d'émission des événements de lineage.

Exemples concrets

OpenLineageMarquezdbt lineage graphDataHub lineage
← Retour au glossaireTermes en “D

Fiche rapide

CatégorieGouvernance
Exemples4 outils / technologies