Régression logistique

Algorithme de classification qui prédit la probabilité qu'un exemple appartienne à une catégorie (oui/non, spam/pas spam, fraude/légitime).

💡Explication simple

Malgré son nom, la régression logistique ne sert pas à prédire un nombre, mais à répondre à une question oui/non. Par exemple : « Ce client va-t-il partir ? » Le modèle calcule une probabilité entre 0 et 1, et on décide qu'au-dessus de 0.5 la réponse est oui. C'est comme une balance qui penche vers 'oui' ou 'non'.

🏗️Exemple concret

Prédire si un email est du spam (1) ou non (0) selon le nombre de liens, les mots utilisés et l'expéditeur. Pour un email contenant 'GRATUIT', '1000' et 50 destinataires, le modèle pourrait prédire une probabilité de spam de 0.94.

∑ Concept clé

P(y=1) = 1 / (1 + e^(-z)), où z = a + a + ... (la fonction sigmoïde transforme un score en probabilité)