🏗️Exemple concret
Pipeline Synapse : des données brutes arrivent dans Azure Data Lake Storage Gen2, Synapse Serverless SQL permet d'explorer ces données sans les bouger, Synapse Spark transforme et nettoie, les données propres sont chargées dans le Synapse Dedicated SQL Pool (Data Warehouse) pour les rapports Power BI.
∑ Concept clé
Coût = SQL Serverless (1$/TB scannés) + Spark Pool (instances, pas de base) + Dedicated Pool (DWU, ~1.2$/DWH100/h)
🎯Quand l'utiliser ?
✓Architecture data complète sur Azure (ingestion → analytics)
✓Projets Azure avec Azure Data Lake Storage Gen2
✓Remplacement ou complément de SQL Server pour l'analytique
✅ Avantages
+Environnement unifié : SQL, Spark, ETL dans une interface
+Intégration native avec les services Azure (ADF, PowerBI, ML)
+Synapse Link pour connecter directement Cosmos DB ou Dataverse
⚠️ Limites
−Interface parfois confuse (beaucoup de fonctionnalités)
−Coûts Dedicated Pool élevés si le Data Warehouse est allumé en permanence
−Moins mature que Databricks sur la partie Spark
🛠️ Outils principaux
Synapse Studio
Azure Data Lake Storage Gen2
Azure Data Factory (pipeline)
Power BI
Azure ML
AzureData WarehouseSparkAnalyticsETL