Méthode d'ensemble qui entraîne plusieurs modèles identiques sur des sous-échantillons bootstrap (tirés avec remise) du dataset d'entraînement, puis agrège leurs prédictions par vote majoritaire (classification) ou moyenne (régression). Chaque modèle voit environ 63% des données uniques (le reste sont des doublons), ce qui introduit de la diversité. Bagging réduit la variance sans augmenter le biais, particulièrement efficace pour les modèles instables comme les arbres de décision profonds. Random Forest est l'algorithme de bagging le plus connu : il ajoute une second source de randomisation en ne considérant qu'un sous-ensemble aléatoire de features à chaque split. L'out-of-bag (OOB) error utilise les échantillons non vus par chaque arbre pour estimer l'erreur de généralisation sans cross-validation séparée.