Data Universe
Newsletter
Accueil/Encyclopédie/Biais algorithmique et fairness
⚠️Gouvernance & QualitéIntermédiaireÉthique IA

Biais algorithmique et fairness

Erreurs systématiques dans les décisions d'un algorithme qui produisent des résultats injustes envers certains groupes, souvent hérités des données historiques biaisées.

💡Explication simple

Si tu entraînes un modèle de recrutement sur des données historiques où 80% des ingénieurs embauchés étaient des hommes, le modèle va apprendre que 'être un homme' est un signal positif pour un poste d'ingénieur. Ce n'est pas une erreur technique — le modèle apprend bien les patterns des données. C'est un biais sociétal amplifié par l'algorithme. Le biais peut venir des données (sous-représentation), du choix des variables (le code postal comme proxy de l'origine ethnique) ou de la métrique d'optimisation (précision moyenne qui masque des performances inégales par groupe).

🏗️Exemple concret

COMPAS, un algorithme américain d'aide à la décision judiciaire pour la récidive, a été analysé et présentait un biais racial : il surestimait le risque de récidive pour les personnes noires (faux positifs ×2) et le sous-estimait pour les personnes blanches (faux négatifs ×2). Ces biais provenaient des données historiques d'arrestation elles-mêmes biaisées par des pratiques policières inégales.

∑ Concept clé

Disparate Impact = P(Y=1|G=minoritaire) / P(Y=1|G=majoritaire). Un ratio < 0.8 est généralement considéré discriminatoire (règle des 4/5ème).

🎯Quand l'utiliser ?

Audit de tout modèle prenant des décisions sur des individus
Systèmes RH (recrutement, promotion, performance)
Scoring crédit, assurance, tarification
Systèmes judiciaires, médicaux, sociaux

✅ Avantages

+Détection préventive des risques légaux (AI Act, discrimination)
+Amélioration de la qualité et de la représentativité des modèles
+Outil de confiance et de communication sur la responsabilité IA

⚠️ Limites

Les définitions de 'fairness' sont multiples et mathématiquement incompatibles
Corriger le biais peut réduire la performance globale
Difficile d'identifier l'origine du biais sans auditabilité du modèle

🛠️ Outils principaux

Fairlearn (Microsoft)
IBM AI Fairness 360
Aequitas
SHAP (pour analyser les contributions de variables protégées)
What-If Tool (Google)
BiaisFairnessÉthiqueAI ActDiscriminationAudit

Concepts liés

⚖️

AI Act européen — Réglementation de l'IA

Conformité

🏦

BCBS 239 — Agrégation des données de risque bancaire

Réglementation

📋

Data Contract

Gouvernance

🏛️

Data Gouvernance

Gouvernance

← Retour à l'encyclopédie