Metaflow est le framework open source de Netflix pour l'ingénierie ML en production. Il permet de définir des workflows ML comme des classes Python décorées (@step), avec gestion automatique des données, versioning, et déploiement sur AWS Batch/SageMaker ou Kubernetes. Metaflow simplifie drastiquement le passage du notebook Python à un pipeline ML reproductible et scalable.
Pipeline de recommandation Netflix-style
Metaflow orchestre l'entraînement hebdomadaire d'un modèle de recommandation : extraction features S3 → entraînement PyTorch distribué sur GPU → évaluation → push vers SageMaker endpoint.
✓ Points forts
✗ Limites
⚠️ Pièges connus en production
✓ Fait pour vous si…
Data scientists qui veulent industrialiser leurs notebooks Python en pipelines ML reproductibles sans apprendre un DSL complexe.
✗ Pas fait pour vous si…
Orchestration de pipelines data généraux (ingest, transform) — préférer Airflow ou Dagster.