Data Universe
Newsletter
GlossairePPolars
Data Engineering

Polars

Définition

Bibliothèque Python de manipulation de données tabulaires écrite en Rust, conçue comme une alternative haute performance à Pandas. Son architecture diffère fondamentalement : moteur d'exécution multithreadé (utilise tous les cœurs CPU), évaluation lazy par défaut (les opérations sont optimisées et fusionnées avant exécution via un plan de requête, comme un moteur SQL), et représentation des données en Apache Arrow (zéro-copie avec d'autres systèmes Arrow). Polars est 5 à 30x plus rapide que Pandas sur la plupart des benchmarks et gère confortablement des datasets dépassant la RAM grâce au streaming. Son API est similaire à Pandas mais plus stricte et expressive, avec une courbe d'apprentissage modérée.

Exemples concrets

Polars pour remplacer PandasLazyFrame pour l'optimisationPolars + Parquet
← Retour au glossaireTermes en “P

Fiche rapide

CatégorieData Engineering
Exemples3 outils / technologies