MLflow est devenu le standard de facto pour le suivi des expériences ML. Créé par Databricks, il couvre le tracking (métriques, paramètres, artefacts), le packaging des modèles, le registry et le déploiement. Agnostique au framework (Scikit-learn, PyTorch, TensorFlow...).
Suivi d'expériences de machine learning
Les data scientists enregistrent automatiquement les hyperparamètres, métriques et artefacts de chaque run d'entraînement pour comparer les expériences via l'interface web MLflow Tracking.
Registre centralisé de modèles ML
MLflow Model Registry stocke les versions successives des modèles avec leurs métadonnées, gère les transitions entre staging, production et archivage avec contrôle d'accès.
Déploiement multi-cibles de modèles
Les modèles packagés au format MLmodel sont déployés vers REST API, Azure ML, AWS SageMaker ou Databricks en une commande, garantissant la reproductibilité entre environnements.
Orchestration de pipelines MLOps
MLflow Projects définit les dépendances et le code d'entraînement comme des unités reproductibles, permettant de rejouer n'importe quelle expérience passée avec exactement le même environnement.
✓ Points forts
✗ Limites
✓ Fait pour vous si…
Tout data scientist ou ML engineer. Point de départ pour le tracking ML avant d'investir dans une plateforme MLOps complète.
✗ Pas fait pour vous si…
Remplacement d'une plateforme MLOps complète (Dataiku, SageMaker) seul.
MLflow in Action
MOOCDataCamp
Machine Learning Engineering with MLflow
MOOCUdemy
Documentation officielle MLflow
DocumentationMLflow / Linux Foundation