Terraform (HashiCorp) est le standard de l'Infrastructure as Code pour les équipes data. Il permet de décrire et versionner toute l'infrastructure cloud (buckets S3, clusters Databricks, warehouses Snowflake, pipelines ADF...) en HCL. Indispensable pour les data engineers gérant des environnements cloud complexes ou multiples (dev/staging/prod).
Provisionnement d'infrastructure cloud reproductible
Terraform décrit l'ensemble d'une infrastructure cloud (VPC, instances, bases de données, load balancers) en code HCL versionné dans Git, permettant de recréer des environnements identiques en quelques minutes sur AWS, Azure ou GCP.
Gestion multi-cloud et hybride
Les entreprises utilisent Terraform pour gérer simultanément des ressources sur plusieurs fournisseurs cloud via des providers officiels, unifiant la gestion d'infrastructure dans un seul workflow et tooling.
Automatisation des environnements data et ML
Les équipes MLOps provisionnent avec Terraform les clusters Kubernetes, les buckets S3, les secrets managers et les pipelines CI/CD nécessaires aux plateformes ML, garantissant la reproductibilité entre dev, staging et production.
Drift detection et gouvernance d'infrastructure
Terraform détecte les écarts entre l'état déclaré dans le code et l'état réel de l'infrastructure (drift), permettant aux équipes de maintenir la conformité de leur environnement et d'auditer les changements.
✓ Points forts
✗ Limites
✓ Fait pour vous si…
Équipes data engineering gérant leur infrastructure cloud (S3, Databricks, Snowflake, ADF...) avec des environnements multiples.
✗ Pas fait pour vous si…
Petites équipes sans besoin de reproductibilité infra. Organisations sans compétences DevOps.
🎓 HashiCorp Certified: Terraform Authoring and Operations Professional
ProfessionnelHashiCorp
Voir la certification →HashiCorp Terraform Associate Certification
Formation officielleHashiCorp Learn
Terraform: The Complete Guide
MOOCUdemy
Terraform Documentation
DocumentationHashiCorp