Data Universe
Newsletter
Accueil/Encyclopédie/Régression logistique
🎯Machine LearningDébutantApprentissage supervisé

Régression logistique

Algorithme de classification qui prédit la probabilité qu'un exemple appartienne à une catégorie (oui/non, spam/pas spam, fraude/légitime).

💡Explication simple

Malgré son nom, la régression logistique ne sert pas à prédire un nombre, mais à répondre à une question oui/non. Par exemple : « Ce client va-t-il partir ? » Le modèle calcule une probabilité entre 0 et 1, et on décide qu'au-dessus de 0.5 la réponse est oui. C'est comme une balance qui penche vers 'oui' ou 'non'.

🏗️Exemple concret

Prédire si un email est du spam (1) ou non (0) selon le nombre de liens, les mots utilisés et l'expéditeur. Pour un email contenant 'GRATUIT', '1000€' et 50 destinataires, le modèle pourrait prédire une probabilité de spam de 0.94.

∑ Concept clé

P(y=1) = 1 / (1 + e^(-z)), où z = a₀ + a₁x₁ + ... (la fonction sigmoïde transforme un score en probabilité)

🎯Quand l'utiliser ?

Classification binaire (deux classes)
Quand on a besoin d'une probabilité interprétable
Détection de fraude, prédiction de churn, scoring crédit

✅ Avantages

+Fournit une probabilité (pas juste une classe)
+Très interprétable (les coefficients ont un sens)
+Bonne baseline pour commencer

⚠️ Limites

Limité aux relations linéaires entre variables et log-odds
Moins performant que XGBoost sur des données complexes

🛠️ Outils principaux

Scikit-learn
Statsmodels
R (glm())
SAS (PROC LOGISTIC)
MLSuperviséClassificationProbabilité

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie