🏗️Exemple concret
Prédire si un email est du spam (1) ou non (0) selon le nombre de liens, les mots utilisés et l'expéditeur. Pour un email contenant 'GRATUIT', '1000€' et 50 destinataires, le modèle pourrait prédire une probabilité de spam de 0.94.
∑ Concept clé
P(y=1) = 1 / (1 + e^(-z)), où z = aâ‚€ + aâ‚xâ‚ + ... (la fonction sigmoïde transforme un score en probabilité)
🎯Quand l'utiliser ?
✓Classification binaire (deux classes)
✓Quand on a besoin d'une probabilité interprétable
✓Détection de fraude, prédiction de churn, scoring crédit
✅ Avantages
+Fournit une probabilité (pas juste une classe)
+Très interprétable (les coefficients ont un sens)
+Bonne baseline pour commencer
⚠️ Limites
−Limité aux relations linéaires entre variables et log-odds
−Moins performant que XGBoost sur des données complexes
🛠️ Outils principaux
Scikit-learn
Statsmodels
R (glm())
SAS (PROC LOGISTIC)
MLSuperviséClassificationProbabilité