Biais algorithmique et fairness

Erreurs systématiques dans les décisions d'un algorithme qui produisent des résultats injustes envers certains groupes, souvent hérités des données historiques biaisées.

💡Explication simple

Si tu entraînes un modèle de recrutement sur des données historiques où 80% des ingénieurs embauchés étaient des hommes, le modèle va apprendre que 'être un homme' est un signal positif pour un poste d'ingénieur. Ce n'est pas une erreur technique — le modèle apprend bien les patterns des données. C'est un biais sociétal amplifié par l'algorithme. Le biais peut venir des données (sous-représentation), du choix des variables (le code postal comme proxy de l'origine ethnique) ou de la métrique d'optimisation (précision moyenne qui masque des performances inégales par groupe).

🏗️Exemple concret

COMPAS, un algorithme américain d'aide à la décision judiciaire pour la récidive, a été analysé et présentait un biais racial : il surestimait le risque de récidive pour les personnes noires (faux positifs 2) et le sous-estimait pour les personnes blanches (faux négatifs 2). Ces biais provenaient des données historiques d'arrestation elles-mêmes biaisées par des pratiques policières inégales.

∑ Concept clé

Disparate Impact = P(Y=1|G=minoritaire) / P(Y=1|G=majoritaire). Un ratio < 0.8 est généralement considéré discriminatoire (règle des 4/5ème).

🎯Quand l'utiliser ?

✓Audit de tout modèle prenant des décisions sur des individus

✓Systèmes RH (recrutement, promotion, performance)

✓Scoring crédit, assurance, tarification

✓Systèmes judiciaires, médicaux, sociaux

✅ Avantages

+Détection préventive des risques légaux (AI Act, discrimination)

+Amélioration de la qualité et de la représentativité des modèles

+Outil de confiance et de communication sur la responsabilité IA

⚠️ Limites

−Les définitions de 'fairness' sont multiples et mathématiquement incompatibles

−Corriger le biais peut réduire la performance globale

−Difficile d'identifier l'origine du biais sans auditabilité du modèle

🛠️ Outils principaux

Fairlearn (Microsoft)

IBM AI Fairness 360

Aequitas

SHAP (pour analyser les contributions de variables protégées)

What-If Tool (Google)

BiaisFairnessÉthiqueAI ActDiscriminationAudit

Concepts liés

⚖️

AI Act européen — Réglementation de l'IA

Conformité

📊

BCBS 239 — Agrégation des données de risque bancaire

Réglementation

📋

Data Contract

Gouvernance

🏛️

Data Gouvernance

Gouvernance

← Retour à l'encyclopédie