Data Universe
Newsletter
GlossaireRRedshift
Infrastructure

Redshift

Définition

Cloud data warehouse d'AWS basé sur une architecture columnar dérivée de PostgreSQL, avec un système de distribution des données entre nœuds (sort key, distribution key) qui nécessite une modélisation soignée pour optimiser les performances. Redshift Spectrum permet d'interroger directement des fichiers Parquet sur S3 sans les charger dans Redshift. Redshift Serverless (lancé en 2022) élimine la gestion des clusters. Son intégration native avec l'écosystème AWS (S3, Glue, SageMaker, IAM) est son principal atout pour les architectures tout-AWS. Il est davantage opérationnel qu'il y a 5 ans, mais Snowflake et BigQuery le surpassent sur la facilité d'administration.

Exemples concrets

Redshift Spectrum (requêtes sur S3)Redshift MLRedshift Serverless
← Retour au glossaireTermes en “R

Fiche rapide

CatégorieInfrastructure
Exemples3 outils / technologies