Traçabilité complète du cycle de vie d'une donnée : de sa source d'origine (système OLTP, fichier, API) à travers toutes ses transformations (jointures, agrégations, enrichissements) jusqu'à ses destinations finales (dashboards, modèles ML, exports). Le lineage permet de répondre à deux questions critiques : impact analysis (si je modifie cette table source, quels pipelines et rapports sont affectés ?) et root cause analysis (d'où vient cette anomalie dans ce KPI ?). En conformité réglementaire, le lineage documente la provenance des données utilisées dans les modèles de scoring, exigé par RGPD et l'AI Act. Des outils comme OpenLineage standardisent le format d'émission des événements de lineage.