Deux variables sont corrélées si elles évoluent ensemble de façon statistiquement associée — mais cette association n'implique pas qu'une cause l'autre. Une variable confondante (confounder) peut expliquer une corrélation apparente : la vente de crème glacée et les noyades sont corrélées, mais c'est la température qui cause les deux. C'est la distinction la plus importante en analyse data pour éviter les décisions erronées. Pour établir la causalité, les expérimentations randomisées (A/B tests, RCT) restent le gold standard. Les méthodes causales (difference-in-differences, regression discontinuity, instrumental variables) permettent d'inférer la causalité observationnelle. Le domaine du causal ML (DoWhy, CausalML) applique ces méthodes à grande échelle.