PCA (Analyse en Composantes Principales)

Définition

Technique de réduction de dimension non supervisée qui transforme un espace de features corrélées en un espace de composantes orthogonales non corrélées, classées par ordre de variance décroissante. Les premières composantes capturent la majorité de l'information, permettant de réduire la dimensionnalité sans perdre l'essentiel. PCA est utile pour visualiser des données haute dimension (projection en 2D ou 3D), réduire le bruit, accélérer l'entraînement et éviter la malédiction de la dimensionnalité. Ses limites : elle capture uniquement les relations linéaires (contrairement à UMAP ou t-SNE qui capturent les structures non-linéaires) et les composantes résultantes sont difficiles à interpréter métier.

Exemples concrets

Scikit-learn PCAVisualisation 2D de clustersPrétraitement avant ML

← Retour au glossaire Termes en “P”

Fiche rapide

CatégorieMachine Learning

Exemples3 outils / technologies

Autres termes en Machine Learning

Anomaly Detection →AutoML →Bagging (Bootstrap Aggregating) →Bias-Variance Tradeoff →Class Imbalance →