🏗️Exemple concret
Segmentation des 50 000 clients d'une banque en 5 profils : 1) Jeunes emprunteurs (K1), 2) Familles établies (K2), 3) Seniors épargne (K3), 4) Entrepreneurs actifs (K4), 5) Premium (K5). Chaque profil reçoit des offres différentes.
∑ Concept clé
Minimise : Σ Σ ||xᵢ - μₖ||² — la distance totale entre chaque point et son centroïde
🎯Quand l'utiliser ?
✓Segmentation client
✓Compression d'image (réduire le nombre de couleurs)
✓Première exploration de données sans labels
✅ Avantages
+Simple et rapide
+Fonctionne bien quand les clusters sont sphériques
+Facile à interpréter : on regarde les centres pour comprendre chaque groupe
⚠️ Limites
−Faut choisir K à l'avance (méthode du coude pour aider)
−Sensible aux outliers et à l'initialisation
−Suppose des clusters de taille similaire et forme sphérique
🛠️ Outils principaux
Scikit-learn
R (kmeans)
SAS (PROC FASTCLUS)
Dataiku (Clustering recipe)
MLNon superviséClusteringSegmentation