Bagging (Bootstrap Aggregating)

Définition

Méthode d'ensemble qui entraîne plusieurs modèles identiques sur des sous-échantillons bootstrap (tirés avec remise) du dataset d'entraînement, puis agrège leurs prédictions par vote majoritaire (classification) ou moyenne (régression). Chaque modèle voit environ 63% des données uniques (le reste sont des doublons), ce qui introduit de la diversité. Bagging réduit la variance sans augmenter le biais, particulièrement efficace pour les modèles instables comme les arbres de décision profonds. Random Forest est l'algorithme de bagging le plus connu : il ajoute une second source de randomisation en ne considérant qu'un sous-ensemble aléatoire de features à chaque split. L'out-of-bag (OOB) error utilise les échantillons non vus par chaque arbre pour estimer l'erreur de généralisation sans cross-validation séparée.

Exemples concrets

Random ForestBaggingClassifier (scikit-learn)Out-of-bag error estimationExtra Trees (ExtraTreesClassifier)

← Retour au glossaire Termes en “B”

Fiche rapide

CatégorieMachine Learning

Exemples4 outils / technologies

Autres termes en Machine Learning

Anomaly Detection →AutoML →Bias-Variance Tradeoff →Class Imbalance →Confusion Matrix →