Data Universe
Newsletter
Accueil/Encyclopédie/Amazon Redshift
🏪CloudIntermédiaireAWS - Data Warehouse

Amazon Redshift

Data Warehouse cloud d'AWS en architecture colonnaire, permettant des analyses SQL rapides sur des pétaoctets de données structurées.

💡Explication simple

Redshift est une base de données spécialisée pour l'analytique, pas pour les transactions. Sa particularité : il stocke les données par colonne plutôt que par ligne. Pour analyser « le chiffre d'affaires total de 2024 », il ne lit que la colonne CA et la colonne date, pas les milliers d'autres colonnes. C'est 10 à 100x plus rapide pour les requêtes analytiques.

🏗️Exemple concret

Entrepôt de données d'un retailer : 3 milliards de transactions de 5 ans (12 TB). Une requête complexe avec 8 jointures sur des tables de plusieurs millions de lignes retourne en 8 secondes sur un cluster ra3.4xlarge à 2 nœuds. Même requête sur PostgreSQL : timeout.

∑ Concept clé

Architecture MPP (Massively Parallel Processing) : Leader Node distribue les requêtes sur N Compute Nodes. Chaque nœud traite une partition des données. Coût ≈ $0.25/heure pour ra3.xlplus.

🎯Quand l'utiliser ?

Data Warehouse SQL pour le reporting et la BI
Requêtes analytiques complexes sur données structurées
Intégration avec QuickSight, Tableau, Power BI

✅ Avantages

+Excellent rapport performance/prix pour SQL analytique
+Redshift Spectrum : SQL direct sur fichiers S3 sans chargement
+Pause automatique (Serverless) pour optimiser les coûts

⚠️ Limites

Moins adapté aux mises à jour fréquentes (OLTP)
Vacuuming et maintenance nécessaires
Concurrence limitée (recommander Snowflake pour > 50 utilisateurs simultanés)

🛠️ Outils principaux

Amazon Redshift
Redshift Serverless
AWS QuickSight
dbt (adapter Redshift)
AWSData WarehouseSQLAnalyticsMPP

Concepts liés

🌊

Amazon Kinesis Data Streams

AWS - Streaming

🪣

Amazon S3 (Simple Storage Service)

AWS - Stockage

🔬

Amazon SageMaker

AWS - Machine Learning

🏔️

AWS Bedrock — IA Générative sur AWS

IA Générative Cloud

← Retour à l'encyclopédie