🏗️Exemple concret
Optimisation d'un XGBoost pour la détection de fraude : Grid Search classique sur 5 paramètres × 10 valeurs = 100 000 combinaisons (impossible). Optuna avec 200 essais en 2 heures : AUC = 0.94 avec learning_rate=0.05, max_depth=6, n_estimators=500. Grid Search sur le même espace : estimerait 3 semaines pour trouver mieux. Gain : 99%+ du temps économisé.
∑ Concept clé
Bayesian Optimization : Surrogate model (Gaussian Process ou Tree Parzen Estimator) + Acquisition function (Expected Improvement : EI(x) = E[max(f(x) - f(x+), 0)]). Optuna utilise TPE (Tree-structured Parzen Estimator).
🎯Quand l'utiliser ?
✓Tout projet ML où les hyperparamètres ont un impact significatif
✓Budget de calcul limité (vs grid search)
✓Pipelines ML automatisés (AutoML)
✅ Avantages
+Bien plus efficace que Grid Search ou Random Search
+Gestion des essais paralèles sur plusieurs GPU/CPU
+Pruning : abandon précoce des essais peu prometteurs
⚠️ Limites
−Ne garantit pas l'optimalité globale
−Overhead de temps pour les modèles rapides (random search peut suffire)
−Hyperparamètres continus vs discrets : sensibilité au type d'espace
🛠️ Outils principaux
Optuna (Python, open source)
Ray Tune
Hyperopt
Scikit-learn RandomizedSearchCV
Databricks AutoML
MLOptimisationAutoMLPerformanceHyperparamètres