🏗️Exemple concret
Décider si on approuve un crédit : Q1 'Revenu > 3000€ ?' → oui → Q2 « Durée de l'emploi > 1 an ? » → oui → Q3 'Endettement < 33% ?' → oui → ACCORDÉ. L'arbre reflète exactement la logique métier.
∑ Concept clé
Critère de division : Gini = 1 - Σ(pᵢ²), où pᵢ est la proportion de chaque classe. On divise pour minimiser le Gini.
🎯Quand l'utiliser ?
✓Quand l'interprétabilité est essentielle (règles métier, conformité)
✓Données mixtes (numériques et catégorielles)
✓Première exploration des données
✅ Avantages
+Visuellement explicable à n'importe qui
+Pas de normalisation des données requise
+Gère automatiquement les valeurs manquantes
⚠️ Limites
−Très sensible au bruit (surapprentissage facile)
−Instable : un petit changement de données change tout l'arbre
−Inférieur aux ensembles (Random Forest, XGBoost)
🛠️ Outils principaux
Scikit-learn (DecisionTreeClassifier)
R (rpart)
SAS (PROC HPSPLIT)
MLSuperviséClassificationRégressionInterprétable