Accueil›Outils›Amazon Redshift

Amazon Redshift

Data Warehouse

Le data warehouse cloud d'AWS, optimisé pour les workloads analytiques massifs

Tarif

Serverless (pay-per-use) ou clusters provisionnés (à partir de ~250€/mois pour ra3.xlplus). Free trial 2 mois.

Free tierIntermédiaire

Présentation

Amazon Redshift est le data warehouse cloud d'AWS, basé sur une architecture colonnaire MPP (Massively Parallel Processing). Très intégré à l'écosystème AWS (S3, Glue, SageMaker, QuickSight). Redshift Serverless permet un usage pay-per-use sans gestion de cluster. Redshift Spectrum permet de requêter directement des fichiers Parquet sur S3.

Fonctionnalités clés

✓Architecture MPP colonnaire pour les requêtes analytiques

✓Redshift Serverless (pay-per-use, auto-scaling)

✓Redshift Spectrum (requêtes sur S3 externe)

✓RA3 nodes avec séparation compute/storage

✓Machine Learning via SQL (CREATE MODEL)

✓Data Sharing entre clusters Redshift

✓Aqua (hardware accéléré pour les requêtes)

✓Intégration native S3, Glue, SageMaker, QuickSight

Cas d'usage

Data warehouse AWS centralisé

Ingestion depuis S3 via Redshift Spectrum, transformations avec dbt, visualisation QuickSight. Tout reste dans l'écosystème AWS.

Analytics marketing à grande échelle

Analyse de logs web (milliards de lignes) avec Redshift Spectrum sur S3, sans charger les données dans le cluster principal.

✓ Points forts

+Intégration native et profonde avec l'écosystème AWS

+Excellentes performances sur les jointures complexes et agrégations

+Redshift Serverless simplifie le démarrage

+Redshift Spectrum évite de dupliquer les données S3

✗ Limites

−Performance VACUUM et ANALYZE à planifier régulièrement

−Moins intuitif que BigQuery ou Snowflake pour les débutants

−Concurrence de requêtes limitée sur les petits clusters

−Vendor lock-in AWS

⚠️ Pièges connus en production

1.Sans VACUUM et ANALYZE réguliers, les performances se dégradent sur les tables avec beaucoup d'UPDATEs/DELETEs.

2.La compression automatique (ENCODE AUTO) est efficace mais peut choisir un encoding sous-optimal pour certains patterns de requête.

3.Les distributions keys mal choisies créent du data skew et des performances catastrophiques sur les jointures.

✓ Fait pour vous si…

Organisations AWS-first avec des besoins analytiques massifs et un besoin d'intégration profonde avec S3, Glue et SageMaker.

✗ Pas fait pour vous si…

Équipes souhaitant éviter AWS ou préférant une architecture plus moderne (Iceberg natif).

cloudsqlanalyticsawsmpp