Data Universe
Newsletter
Accueil/Encyclopédie/Arbre de décision
🌳Machine LearningDébutantApprentissage supervisé

Arbre de décision

Modèle qui prend des décisions par une série de questions oui/non, comme un jeu de 20 questions. Très lisible et explicable.

💡Explication simple

Un arbre de décision ressemble à un arbre généalogique à l'envers. À chaque nœud, le modèle pose une question : 'L'âge est-il > 30 ans ?' Si oui, il va à droite, si non, à gauche. Il continue à poser des questions jusqu'à arriver à une feuille qui donne la réponse. Tu peux le dessiner sur une feuille de papier !

🏗️Exemple concret

Décider si on approuve un crédit : Q1 'Revenu > 3000€ ?' → oui → Q2 « Durée de l'emploi > 1 an ? » → oui → Q3 'Endettement < 33% ?' → oui → ACCORDÉ. L'arbre reflète exactement la logique métier.

∑ Concept clé

Critère de division : Gini = 1 - Σ(pᵢ²), où pᵢ est la proportion de chaque classe. On divise pour minimiser le Gini.

🎯Quand l'utiliser ?

Quand l'interprétabilité est essentielle (règles métier, conformité)
Données mixtes (numériques et catégorielles)
Première exploration des données

✅ Avantages

+Visuellement explicable à n'importe qui
+Pas de normalisation des données requise
+Gère automatiquement les valeurs manquantes

⚠️ Limites

Très sensible au bruit (surapprentissage facile)
Instable : un petit changement de données change tout l'arbre
Inférieur aux ensembles (Random Forest, XGBoost)

🛠️ Outils principaux

Scikit-learn (DecisionTreeClassifier)
R (rpart)
SAS (PROC HPSPLIT)
MLSuperviséClassificationRégressionInterprétable

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🤖

AutoML (Machine Learning Automatisé)

Automatisation ML

← Retour à l'encyclopédie