Cross-validation

Définition

Technique d'évaluation robuste qui divise le dataset en k sous-ensembles (folds) et effectue k itérations : à chaque fois, k-1 folds servent à l'entraînement et le fold restant à l'évaluation. La performance finale est la moyenne des k évaluations. Cela donne une estimation beaucoup plus fiable qu'une simple division train/test, en réduisant la variance due au hasard de la partition. La cross-validation stratifiée (Stratified K-fold) maintient la distribution des classes à chaque fold, essentielle pour les datasets déséquilibrés. Pour les séries temporelles, le time-series split respecte l'ordre chronologique pour éviter la fuite de données (data leakage).

Exemples concrets

K-fold CV (k=5 ou 10)Stratified K-foldTime-series split

← Retour au glossaire Termes en “C”

Fiche rapide

CatégorieMachine Learning

Exemples3 outils / technologies

Autres termes en Machine Learning

Anomaly Detection →AutoML →Bagging (Bootstrap Aggregating) →Bias-Variance Tradeoff →Class Imbalance →