Data Universe
Newsletter
GlossaireDDBSCAN
Machine Learning

DBSCAN

Définition

Algorithme de clustering basé sur la densité (Density-Based Spatial Clustering of Applications with Noise) qui groupe les points suffisamment proches les uns des autres et marque comme bruit (noise) les points isolés. Deux paramètres : epsilon (rayon maximal du voisinage) et min_samples (nombre minimum de points dans le rayon pour former un cluster). Un point est 'core' si son voisinage contient au moins min_samples points, 'border' s'il est dans le voisinage d'un core point, ou 'noise' sinon. Avantages vs K-means : découvre des clusters de forme arbitraire (pas seulement sphériques), détecte nativement les anomalies (points noise), ne nécessite pas de spécifier le nombre de clusters. Limites : difficile à paramétrer, performances dégradées en haute dimension, sensible à la densité variable entre clusters.

Exemples concrets

DBSCAN (scikit-learn)Détection d'anomalies géospatialesClustering de trajectoires GPSHDBSCAN (version améliorée)
← Retour au glossaireTermes en “D

Fiche rapide

CatégorieMachine Learning
Exemples4 outils / technologies