Algorithme de clustering qui partitionne les données en K groupes en minimisant la somme des distances intra-cluster. L'algorithme itère entre deux étapes : assigner chaque point au centroïde le plus proche, puis recalculer les centroïdes comme la moyenne des points assignés, jusqu'à convergence. Simple et rapide, K-means suppose des clusters convexes et de tailles similaires, ce qui est rarement le cas en pratique. Il est sensible aux outliers (qui tirent les centroïdes) et au choix de K (la méthode du coude ou le silhouette score aident à le choisir). Pour des clusters de formes arbitraires, DBSCAN est plus adapté.