Decision Tree

Définition

Algorithme d'apprentissage supervisé qui partitionne récursivement les données en posant des questions binaires sur les features (ex : 'âge > 30 ?') pour créer un arbre de décision. À chaque nœud, l'algorithme choisit le split qui maximise la pureté des sous-ensembles résultants, mesurée par l'entropie, le gain d'information (ID3, C4.5) ou l'impureté de Gini (CART). Les feuilles contiennent les prédictions (classe majoritaire pour la classification, moyenne pour la régression). Avantages : interprétabilité native (les règles de décision sont lisibles), pas de normalisation des données requise, gestion des valeurs manquantes. Inconvénient majeur : haute variance — un petit changement dans les données peut produire un arbre complètement différent. Utilisé surtout comme brique de base des ensembles (Random Forest, XGBoost) plutôt que seul.

Exemples concrets

DecisionTreeClassifier (scikit-learn)CART algorithmFeature importance via GiniDecision Tree dans XGBoost

← Retour au glossaire Termes en “D”

Fiche rapide

CatégorieMachine Learning

Exemples4 outils / technologies

Autres termes en Machine Learning

Anomaly Detection →AutoML →Bagging (Bootstrap Aggregating) →Bias-Variance Tradeoff →Class Imbalance →