Data Universe
Newsletter
GlossaireCCorrelation vs Causalité
Statistiques

Correlation vs Causalité

Définition

Deux variables sont corrélées si elles évoluent ensemble de façon statistiquement associée — mais cette association n'implique pas qu'une cause l'autre. Une variable confondante (confounder) peut expliquer une corrélation apparente : la vente de crème glacée et les noyades sont corrélées, mais c'est la température qui cause les deux. C'est la distinction la plus importante en analyse data pour éviter les décisions erronées. Pour établir la causalité, les expérimentations randomisées (A/B tests, RCT) restent le gold standard. Les méthodes causales (difference-in-differences, regression discontinuity, instrumental variables) permettent d'inférer la causalité observationnelle. Le domaine du causal ML (DoWhy, CausalML) applique ces méthodes à grande échelle.

Exemples concrets

Crème glacée et noyades (variable confondante : chaleur)DoWhy (causal ML)
← Retour au glossaireTermes en “C

Fiche rapide

CatégorieStatistiques
Exemples2 outils / technologies