Data Universe
Newsletter
Accueil/Encyclopédie/Azure Data Factory (ADF)
🏭CloudIntermédiaireAzure - Orchestration

Azure Data Factory (ADF)

Service d'orchestration et d'intégration de données Azure. Crée des pipelines ETL visuellement pour déplacer et transformer des données entre des centaines de sources.

💡Explication simple

ADF est un chef d'orchestre data sur Azure : il sait parler à 90+ systèmes différents (SQL Server, Oracle, Salesforce, SAP, Dynamics, Snowflake, etc.) et peut automatiser le déplacement des données entre eux. Tu dessines le pipeline visuellement (drag & drop), tu planifies l'exécution, et ADF gère la connectivité, les erreurs et le monitoring.

🏗️Exemple concret

Migration d'un ERP SAP vers Azure Synapse : ADF copie 200 tables SAP chaque nuit (Copy Activity), transforme les données avec Data Flow (Spark managé), charge dans Azure Data Lake, puis déclenche un refresh Power BI. Pipeline créé en 3 semaines vs 6 mois avec un ETL classique.

∑ Concept clé

Coût = (Data movement: $0.25/DIU-h) + (Pipelines exécutés: $1/1000 runs) + (Data Flow: $0.274/vCore-h)

🎯Quand l'utiliser ?

Intégration de données d'entreprise sur Azure (on-premise vers cloud)
Pipelines ETL visuels sans code
Orchestration de jobs Databricks ou HDInsight

✅ Avantages

+90+ connecteurs natifs (SAP, Oracle, Salesforce...)
+Interface visuelle drag-and-drop
+Integration Runtime pour accéder aux données on-premise

⚠️ Limites

Data Flows (Spark managé) coûteux pour des transformations fréquentes
Moins flexible que dbt pour les transformations SQL complexes
Monitoring limité vs Airflow

🛠️ Outils principaux

Azure Data Factory
Azure Synapse Analytics (inclut ADF)
Azure Integration Runtime
AzureETLOrchestrationData Engineering

Concepts liés

🌊

Amazon Kinesis Data Streams

AWS - Streaming

🏪

Amazon Redshift

AWS - Data Warehouse

🪣

Amazon S3 (Simple Storage Service)

AWS - Stockage

🔬

Amazon SageMaker

AWS - Machine Learning

← Retour à l'encyclopédie