Azure Synapse Analytics

La plateforme data analytics unifiée de Microsoft. Combine SQL serverless, Spark, Data Factory et Power BI dans un seul environnement.

💡Explication simple

Synapse, c'est comme un couteau suisse pour la data sur Azure. Dans une seule interface, tu peux : faire du SQL sur des fichiers dans Azure Data Lake (sans les charger), lancer des jobs Spark pour transformer des données, créer des pipelines ETL (comme Data Factory), et connecter directement Power BI. C'est la réponse Microsoft à BigQuery + Databricks.

🏗️Exemple concret

Pipeline Synapse : des données brutes arrivent dans Azure Data Lake Storage Gen2, Synapse Serverless SQL permet d'explorer ces données sans les bouger, Synapse Spark transforme et nettoie, les données propres sont chargées dans le Synapse Dedicated SQL Pool (Data Warehouse) pour les rapports Power BI.

∑ Concept clé

Coût = SQL Serverless (1$/TB scannés) + Spark Pool (instances, pas de base) + Dedicated Pool (DWU, ~1.2$/DWH100/h)

🎯Quand l'utiliser ?

✓Architecture data complète sur Azure (ingestion analytics)

✓Projets Azure avec Azure Data Lake Storage Gen2

✓Remplacement ou complément de SQL Server pour l'analytique

✅ Avantages

+Environnement unifié : SQL, Spark, ETL dans une interface

+Intégration native avec les services Azure (ADF, PowerBI, ML)

+Synapse Link pour connecter directement Cosmos DB ou Dataverse

⚠️ Limites

−Interface parfois confuse (beaucoup de fonctionnalités)

−Coûts Dedicated Pool élevés si le Data Warehouse est allumé en permanence

−Moins mature que Databricks sur la partie Spark

🛠️ Outils principaux

Synapse Studio

Azure Data Lake Storage Gen2

Azure Data Factory (pipeline)

Power BI

Azure ML

AzureData WarehouseSparkAnalyticsETL

Concepts liés

☁️

Amazon Kinesis Data Streams

AWS - Streaming

☁️

Amazon Redshift

AWS - Data Warehouse

🔗

Amazon S3 (Simple Storage Service)

AWS - Stockage

☁️

Amazon SageMaker

AWS - Machine Learning

← Retour à l'encyclopédie