ObservabilitÃ© des donnÃ©es

Définition

CapacitÃ© Ã comprendre en continu l'Ã©tat de santÃ© des donnÃ©es en production, en surveillant cinq piliers clÃ©s : la fraÃ®cheur (les donnÃ©es ont-elles Ã©tÃ© mises Ã jour comme prÃ©vu ?), le volume (le nombre de lignes est-il normal ?), la distribution (les statistiques des colonnes ont-elles changÃ© brutalement ?), le schÃ©ma (une colonne a-t-elle Ã©tÃ© ajoutÃ©e ou supprimÃ©e ?) et la lignÃ©e (les dÃ©pendances sont-elles intactes ?). Cette discipline, popularisÃ©e par Monte Carlo, s'inspire de l'observabilitÃ© logicielle (logs, mÃ©triques, traces). L'objectif est de dÃ©tecter proactivement les incidents de donnÃ©es (data downtime) avant qu'ils n'impactent les dÃ©cisions business ou les modÃ¨les ML.

Exemples concrets

Monte CarloBigeyeAcceldataDatafold

← Retour au glossaire Termes en “O”

Fiche rapide

Exemples4 outils / technologies

Data Cleansing →Data Profiling →Data Quality →Great Expectations →Imputation (Valeurs Manquantes) →

ObservabilitÃ© des donnÃ©es

Définition

Exemples concrets

Fiche rapide

Autres termes en QualitÃ©