La courbe ROC (Receiver Operating Characteristic) visualise la performance d'un classifieur binaire pour tous les seuils de décision possibles, en traçant le Taux de Vrais Positifs (recall) en fonction du Taux de Faux Positifs. Une courbe idéale tend vers le coin supérieur gauche. L'AUC (Area Under the Curve) résume la courbe en un seul chiffre entre 0 et 1 : AUC = 0.5 est équivalent à un classifieur aléatoire, AUC = 1.0 est parfait. L'AUC mesure la probabilité qu'un exemple positif soit mieux scoré qu'un exemple négatif. C'est une métrique robuste aux classes déséquilibrées et indépendante du seuil choisi. Pour les datasets très déséquilibrés, la PR-AUC (area under precision-recall curve) est préférable à la ROC-AUC car elle est plus sensible aux performances sur la classe minoritaire.