Paradigme d'apprentissage automatique où le modèle apprend à partir d'exemples étiquetés (paires input/output connues), en cherchant à généraliser la relation entre les entrées et les sorties. Il couvre deux grandes familles de tâches : la classification (prédire une catégorie discrète : fraude/non-fraude, churn/non-churn) et la régression (prédire une valeur continue : prix, durée, montant). La qualité et la quantité des labels sont les facteurs limitants : obtenir des données étiquetées est souvent le travail le plus coûteux d'un projet ML. Le modèle est évalué sur des données qu'il n'a pas vues pendant l'entraînement (ensemble de test) pour mesurer sa capacité de généralisation.