Machine Learning

DBSCAN

Définition

Algorithme de clustering basé sur la densité (Density-Based Spatial Clustering of Applications with Noise) qui groupe les points suffisamment proches les uns des autres et marque comme bruit (noise) les points isolés. Deux paramètres : epsilon (rayon maximal du voisinage) et min_samples (nombre minimum de points dans le rayon pour former un cluster). Un point est 'core' si son voisinage contient au moins min_samples points, 'border' s'il est dans le voisinage d'un core point, ou 'noise' sinon. Avantages vs K-means : découvre des clusters de forme arbitraire (pas seulement sphériques), détecte nativement les anomalies (points noise), ne nécessite pas de spécifier le nombre de clusters. Limites : difficile à paramétrer, performances dégradées en haute dimension, sensible à la densité variable entre clusters.

Exemples concrets

DBSCAN (scikit-learn)Détection d'anomalies géospatialesClustering de trajectoires GPSHDBSCAN (version améliorée)

← Retour au glossaire Termes en “D”

Fiche rapide

CatégorieMachine Learning

Exemples4 outils / technologies

Autres termes en Machine Learning

Anomaly Detection →AutoML →Bagging (Bootstrap Aggregating) →Bias-Variance Tradeoff →Class Imbalance →