Data Universe
Newsletter
GlossaireDDecision Tree
Machine Learning

Decision Tree

Définition

Algorithme d'apprentissage supervisé qui partitionne récursivement les données en posant des questions binaires sur les features (ex : 'âge > 30 ?') pour créer un arbre de décision. À chaque nœud, l'algorithme choisit le split qui maximise la pureté des sous-ensembles résultants, mesurée par l'entropie, le gain d'information (ID3, C4.5) ou l'impureté de Gini (CART). Les feuilles contiennent les prédictions (classe majoritaire pour la classification, moyenne pour la régression). Avantages : interprétabilité native (les règles de décision sont lisibles), pas de normalisation des données requise, gestion des valeurs manquantes. Inconvénient majeur : haute variance — un petit changement dans les données peut produire un arbre complètement différent. Utilisé surtout comme brique de base des ensembles (Random Forest, XGBoost) plutôt que seul.

Exemples concrets

DecisionTreeClassifier (scikit-learn)CART algorithmFeature importance via GiniDecision Tree dans XGBoost
← Retour au glossaireTermes en “D

Fiche rapide

CatégorieMachine Learning
Exemples4 outils / technologies