Data Universe
Newsletter
GlossairePPCA (Analyse en Composantes Principales)
Machine Learning

PCA (Analyse en Composantes Principales)

Définition

Technique de réduction de dimension non supervisée qui transforme un espace de features corrélées en un espace de composantes orthogonales non corrélées, classées par ordre de variance décroissante. Les premières composantes capturent la majorité de l'information, permettant de réduire la dimensionnalité sans perdre l'essentiel. PCA est utile pour visualiser des données haute dimension (projection en 2D ou 3D), réduire le bruit, accélérer l'entraînement et éviter la malédiction de la dimensionnalité. Ses limites : elle capture uniquement les relations linéaires (contrairement à UMAP ou t-SNE qui capturent les structures non-linéaires) et les composantes résultantes sont difficiles à interpréter métier.

Exemples concrets

Scikit-learn PCAVisualisation 2D de clustersPrétraitement avant ML
← Retour au glossaireTermes en “P

Fiche rapide

CatégorieMachine Learning
Exemples3 outils / technologies