Data Universe
Newsletter
GlossaireKK-means
Machine Learning

K-means

Définition

Algorithme de clustering qui partitionne les données en K groupes en minimisant la somme des distances intra-cluster. L'algorithme itère entre deux étapes : assigner chaque point au centroïde le plus proche, puis recalculer les centroïdes comme la moyenne des points assignés, jusqu'à convergence. Simple et rapide, K-means suppose des clusters convexes et de tailles similaires, ce qui est rarement le cas en pratique. Il est sensible aux outliers (qui tirent les centroïdes) et au choix de K (la méthode du coude ou le silhouette score aident à le choisir). Pour des clusters de formes arbitraires, DBSCAN est plus adapté.

Exemples concrets

Segmentation clientsCompression d'imagesDétection d'anomalies
← Retour au glossaireTermes en “K

Fiche rapide

CatégorieMachine Learning
Exemples3 outils / technologies