Data Universe
Newsletter
Accueil/Encyclopédie/Validation croisée (Cross-validation)
🔄Machine LearningIntermédiaireÉvaluation ML

Validation croisée (Cross-validation)

Technique d'évaluation qui divise le dataset en plusieurs sous-ensembles pour entraîner et tester le modèle plusieurs fois, donnant une estimation plus fiable des performances réelles.

💡Explication simple

Au lieu d'une seule division données train/test (qui peut être chanceuse ou malchanceuse), la validation croisée à 5 folds divise les données en 5 groupes égaux. Elle entraîne 5 modèles différents, chacun testé sur un groupe différent. La performance finale est la moyenne des 5 résultats. C'est comme passer 5 examens différents plutôt qu'un seul pour évaluer ton niveau.

🏗️Exemple concret

Entraînement d'un modèle de fraude sur 100 000 transactions : avec un simple train/test split, on obtient AUC = 0.88. Mais avec une validation croisée à 5 folds, on obtient AUC moyen = 0.84 ± 0.03. L'écart type nous dit que le modèle est stable (pas de surapprentissage sur un sous-ensemble particulier).

∑ Concept clé

K-fold CV : Score = (1/K) Σ score(modèle entraîné sur K-1 folds, testé sur le fold k). K=5 ou K=10 sont les valeurs standard.

🎯Quand l'utiliser ?

Sélection de modèle et tuning d'hyperparamètres
Quand le dataset est petit (< 10 000 exemples)
Validation rigoureuse avant mise en production

✅ Avantages

+Estimation plus fiable (moins de variance)
+Utilise toutes les données pour l'entraînement ET le test
+Détecte le surapprentissage

⚠️ Limites

K fois plus lent à entraîner
Risque de data leakage si mal implémenté (features temporelles)
Pas adapté aux séries temporelles (utiliser TimeSeriesSplit)

🛠️ Outils principaux

Scikit-learn (cross_val_score, KFold)
MLflow
Optuna
MLÉvaluationValidationBonnes pratiques

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie