Data Universe
Newsletter
Accueil/Encyclopédie/Classification multi-label
🏷️Machine LearningIntermédiaireApprentissage supervisé

Classification multi-label

Problème de classification où un exemple peut appartenir à plusieurs classes simultanément, contrairement à la classification binaire ou multi-classe classique.

💡Explication simple

Un article de presse peut être à la fois 'Technologie', 'Finance' ET 'Politique'. Un film peut être 'Action', 'Comédie' et 'Romance' en même temps. C'est différent de la classification multi-classe où l'on choisit une seule étiquette. Pour chaque label, le modèle prédit une probabilité indépendante. Tu peux avoir autant de labels actifs que voulu.

🏗️Exemple concret

Un système de tagging automatique de tickets support classifie chaque ticket selon les dimensions : urgence (Faible/Moyenne/Haute), département (IT/Facturation/Technique/Commercial), et produit concerné. Un même ticket peut être tagué 'Haute urgence + Facturation + Produit A'. XGBoost avec Binary Relevance atteint un F1-macro de 0.83.

∑ Concept clé

Binary Relevance : entraîner K classifieurs binaires indépendants, un par label. Prédiction : {label k si P(y_k=1|X) > seuil_k}

🎯Quand l'utiliser ?

Tagging automatique de contenu (articles, images, vidéos)
Classification de documents légaux ou médicaux (plusieurs codes possibles)
Systèmes de recommandation de tags
Tout problème où les catégories ne sont pas mutuellement exclusives

✅ Avantages

+Reflète mieux la réalité que forcer une seule étiquette
+Les bibliothèques modernes simplifient l'implémentation
+Permet des seuils de décision indépendants par label

⚠️ Limites

L'évaluation est plus complexe (Hamming loss, F1-macro vs micro)
La corrélation entre labels est ignorée en Binary Relevance
Classes très déséquilibrées par label

🛠️ Outils principaux

Scikit-learn (MultiLabelBinarizer)
scikit-multilearn
Hugging Face (fine-tuning BERT multi-label)
Dataiku
MLClassificationMulti-labelNLPTagging

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie