🏗️Exemple concret
Classification de emails en spam/non-spam : SVM trouve la frontière dans un espace à 1000 dimensions (les 1000 mots les plus fréquents) qui sépare le mieux les emails spam des emails légitimes. Avec un noyau RBF, il peut capturer des séparations non linéaires que la régression logistique raterait.
∑ Concept clé
Maximiser : 2/||w|| (la marge), sous contrainte : yᵢ(w·xᵢ + b) ≥ 1. Le noyau K(x,z) permet d'opérer dans un espace de grande dimension sans calcul explicite.
🎯Quand l'utiliser ?
✓Données de haute dimension (texte, génomique)
✓Quand les données sont peu nombreuses mais bien séparables
✓Classification binaire avec bonne marge naturelle
✅ Avantages
+Très efficace en haute dimension
+Robuste aux outliers (seuls les vecteurs de support comptent)
+Polyvalent grâce aux noyaux (linéaire, RBF, polynomial)
⚠️ Limites
−Lent sur de très grands datasets
−Choix du noyau et des hyperparamètres complexe
−Peu interprétable
🛠️ Outils principaux
Scikit-learn (SVC)
libSVM
LIBLINEAR
MLSuperviséClassificationHaute dimension