Data Universe
Newsletter
GlossaireCCross-validation
Machine Learning

Cross-validation

Définition

Technique d'évaluation robuste qui divise le dataset en k sous-ensembles (folds) et effectue k itérations : à chaque fois, k-1 folds servent à l'entraînement et le fold restant à l'évaluation. La performance finale est la moyenne des k évaluations. Cela donne une estimation beaucoup plus fiable qu'une simple division train/test, en réduisant la variance due au hasard de la partition. La cross-validation stratifiée (Stratified K-fold) maintient la distribution des classes à chaque fold, essentielle pour les datasets déséquilibrés. Pour les séries temporelles, le time-series split respecte l'ordre chronologique pour éviter la fuite de données (data leakage).

Exemples concrets

K-fold CV (k=5 ou 10)Stratified K-foldTime-series split
← Retour au glossaireTermes en “C

Fiche rapide

CatégorieMachine Learning
Exemples3 outils / technologies