Data Universe
Newsletter
Accueil/Encyclopédie/SVM (Support Vector Machine)
⚔️Machine LearningIntermédiaireApprentissage supervisé

SVM (Support Vector Machine)

Algorithme qui trouve la frontière optimale entre des classes en maximisant la marge entre les points les plus proches de chaque groupe.

💡Explication simple

Imagine deux groupes de billes rouges et bleues mélangées sur une table. Tu veux tracer une ligne qui les sépare le mieux possible en laissant le plus d'espace de chaque côté. SVM fait exactement ça : il cherche la ligne (ou surface en plusieurs dimensions) qui maximise l'espace entre les deux groupes. Les billes les plus proches de cette ligne sont appelées « vecteurs de support ».

🏗️Exemple concret

Classification de emails en spam/non-spam : SVM trouve la frontière dans un espace à 1000 dimensions (les 1000 mots les plus fréquents) qui sépare le mieux les emails spam des emails légitimes. Avec un noyau RBF, il peut capturer des séparations non linéaires que la régression logistique raterait.

∑ Concept clé

Maximiser : 2/||w|| (la marge), sous contrainte : yᵢ(w·xᵢ + b) ≥ 1. Le noyau K(x,z) permet d'opérer dans un espace de grande dimension sans calcul explicite.

🎯Quand l'utiliser ?

Données de haute dimension (texte, génomique)
Quand les données sont peu nombreuses mais bien séparables
Classification binaire avec bonne marge naturelle

✅ Avantages

+Très efficace en haute dimension
+Robuste aux outliers (seuls les vecteurs de support comptent)
+Polyvalent grâce aux noyaux (linéaire, RBF, polynomial)

⚠️ Limites

Lent sur de très grands datasets
Choix du noyau et des hyperparamètres complexe
Peu interprétable

🛠️ Outils principaux

Scikit-learn (SVC)
libSVM
LIBLINEAR
MLSuperviséClassificationHaute dimension

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie