Kubernetes est le système d'orchestration de containers standard pour la production. Chaque composant de votre stack data peut tourner sur K8s : Airflow (via Helm), Kafka, Spark Operator, Ray on Kubernetes, MLflow, et les endpoints de serving de modèles ML. K8s gère l'auto-scaling, la haute disponibilité, les rolling updates et la gestion des ressources GPU.
Data platform sur Kubernetes
Airflow (via Helm), MLflow, Kafka, Spark Operator et vLLM déployés sur un cluster GKE autopilot. Les jobs Spark scalent de 0 à 100 workers selon la charge.
✓ Points forts
✗ Limites
⚠️ Pièges connus en production
✓ Fait pour vous si…
Grandes équipes data avec des workloads ML à grande échelle, des clusters Spark/Kafka/Airflow, et besoin d'auto-scaling et haute disponibilité.
✗ Pas fait pour vous si…
Petites équipes data sans expertise DevOps/SRE ou workloads simples.