Classification multi-label

Problème de classification où un exemple peut appartenir à plusieurs classes simultanément, contrairement à la classification binaire ou multi-classe classique.

💡Explication simple

Un article de presse peut être à la fois 'Technologie', 'Finance' ET 'Politique'. Un film peut être 'Action', 'Comédie' et 'Romance' en même temps. C'est différent de la classification multi-classe où l'on choisit une seule étiquette. Pour chaque label, le modèle prédit une probabilité indépendante. Tu peux avoir autant de labels actifs que voulu.

🏗️Exemple concret

Un système de tagging automatique de tickets support classifie chaque ticket selon les dimensions : urgence (Faible/Moyenne/Haute), département (IT/Facturation/Technique/Commercial), et produit concerné. Un même ticket peut être tagué 'Haute urgence + Facturation + Produit A'. XGBoost avec Binary Relevance atteint un F1-macro de 0.83.

∑ Concept clé

Binary Relevance : entraîner K classifieurs binaires indépendants, un par label. Prédiction : {label k si P(y_k=1|X) > seuil_k}

🎯Quand l'utiliser ?

✓Tagging automatique de contenu (articles, images, vidéos)

✓Classification de documents légaux ou médicaux (plusieurs codes possibles)

✓Systèmes de recommandation de tags

✓Tout problème où les catégories ne sont pas mutuellement exclusives

✅ Avantages

+Reflète mieux la réalité que forcer une seule étiquette

+Les bibliothèques modernes simplifient l'implémentation

+Permet des seuils de décision indépendants par label

⚠️ Limites

−L'évaluation est plus complexe (Hamming loss, F1-macro vs micro)

−La corrélation entre labels est ignorée en Binary Relevance

−Classes très déséquilibrées par label

🛠️ Outils principaux

Scikit-learn (MultiLabelBinarizer)

scikit-multilearn

Hugging Face (fine-tuning BERT multi-label)

Dataiku

MLClassificationMulti-labelNLPTagging

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

💬

Analyse de sentiment (NLP)

NLP

🤖

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie