Data Universe
Newsletter
AccueilOutilsAmazon Redshift
🔴

Amazon Redshift

Data Warehouse

Le data warehouse cloud d'AWS, optimisé pour les workloads analytiques massifs

Tarif

Serverless (pay-per-use) ou clusters provisionnés (à partir de ~250€/mois pour ra3.xlplus). Free trial 2 mois.

Free tierIntermédiaire

Amazon Redshift est le data warehouse cloud d'AWS, basé sur une architecture colonnaire MPP (Massively Parallel Processing). Très intégré à l'écosystème AWS (S3, Glue, SageMaker, QuickSight). Redshift Serverless permet un usage pay-per-use sans gestion de cluster. Redshift Spectrum permet de requêter directement des fichiers Parquet sur S3.

Architecture MPP colonnaire pour les requêtes analytiques
Redshift Serverless (pay-per-use, auto-scaling)
Redshift Spectrum (requêtes sur S3 externe)
RA3 nodes avec séparation compute/storage
Machine Learning via SQL (CREATE MODEL)
Data Sharing entre clusters Redshift
Aqua (hardware accéléré pour les requêtes)
Intégration native S3, Glue, SageMaker, QuickSight
1

Data warehouse AWS centralisé

Ingestion depuis S3 via Redshift Spectrum, transformations avec dbt, visualisation QuickSight. Tout reste dans l'écosystème AWS.

2

Analytics marketing à grande échelle

Analyse de logs web (milliards de lignes) avec Redshift Spectrum sur S3, sans charger les données dans le cluster principal.

✓ Points forts

+Intégration native et profonde avec l'écosystème AWS
+Excellentes performances sur les jointures complexes et agrégations
+Redshift Serverless simplifie le démarrage
+Redshift Spectrum évite de dupliquer les données S3

✗ Limites

Performance VACUUM et ANALYZE à planifier régulièrement
Moins intuitif que BigQuery ou Snowflake pour les débutants
Concurrence de requêtes limitée sur les petits clusters
Vendor lock-in AWS

⚠️ Pièges connus en production

1.Sans VACUUM et ANALYZE réguliers, les performances se dégradent sur les tables avec beaucoup d'UPDATEs/DELETEs.
2.La compression automatique (ENCODE AUTO) est efficace mais peut choisir un encoding sous-optimal pour certains patterns de requête.
3.Les distributions keys mal choisies créent du data skew et des performances catastrophiques sur les jointures.

✓ Fait pour vous si…

Organisations AWS-first avec des besoins analytiques massifs et un besoin d'intégration profonde avec S3, Glue et SageMaker.

✗ Pas fait pour vous si…

Équipes souhaitant éviter AWS ou préférant une architecture plus moderne (Iceberg natif).

cloudsqlanalyticsawsmpp