🏗️Exemple concret
Entrepôt de données d'un retailer : 3 milliards de transactions de 5 ans (12 TB). Une requête complexe avec 8 jointures sur des tables de plusieurs millions de lignes retourne en 8 secondes sur un cluster ra3.4xlarge à 2 nœuds. Même requête sur PostgreSQL : timeout.
∑ Concept clé
Architecture MPP (Massively Parallel Processing) : Leader Node distribue les requêtes sur N Compute Nodes. Chaque nœud traite une partition des données. Coût ≈ $0.25/heure pour ra3.xlplus.
🎯Quand l'utiliser ?
✓Data Warehouse SQL pour le reporting et la BI
✓Requêtes analytiques complexes sur données structurées
✓Intégration avec QuickSight, Tableau, Power BI
✅ Avantages
+Excellent rapport performance/prix pour SQL analytique
+Redshift Spectrum : SQL direct sur fichiers S3 sans chargement
+Pause automatique (Serverless) pour optimiser les coûts
⚠️ Limites
−Moins adapté aux mises à jour fréquentes (OLTP)
−Vacuuming et maintenance nécessaires
−Concurrence limitée (recommander Snowflake pour > 50 utilisateurs simultanés)
🛠️ Outils principaux
Amazon Redshift
Redshift Serverless
AWS QuickSight
dbt (adapter Redshift)
AWSData WarehouseSQLAnalyticsMPP