Data Universe
Newsletter
GlossaireDData Catalog
Gouvernance

Data Catalog

Définition

Inventaire centralisé et searchable de toutes les données d'une organisation, enrichi de métadonnées techniques (schéma, type, localisation, taille) et métier (description, propriétaire, usage, sensibilité). Il permet aux équipes de découvrir les données disponibles, comprendre leur contexte et évaluer leur qualité avant de les utiliser, sans avoir à interroger directement les bases ou à solliciter une équipe data. Les data catalogs modernes intègrent des capacités de lineage automatique (traçabilité des transformations), de profiling (statistiques sur les distributions) et même des recommandations ML pour enrichir automatiquement les métadonnées. Sans catalog, le temps de découverte des données représente souvent 50% du temps d'un data scientist.

Exemples concrets

DataHubAmundsenAtlanAlationdbt docs
← Retour au glossaireTermes en “D

Fiche rapide

CatégorieGouvernance
Exemples5 outils / technologies