Hyperparameter Tuning — Optuna et Bayesian Optimization

Techniques automatisées pour trouver les meilleurs hyperparamètres d'un modèle ML, remplaçant la grid search par des méthodes intelligentes qui apprennent des essais précédents.

💡Explication simple

Un modèle XGBoost a des dizaines d'hyperparamètres : learning_rate, max_depth, n_estimators, subsample... Tester toutes les combinaisons (grid search) prendrait des semaines. La Bayesian Optimization est intelligente : après chaque essai, elle construit un modèle de substitution qui prédit quelle combinaison essayer ensuite. Comme un chercheur qui apprend de ses expériences au lieu de tout tester aveuglément.

🏗️Exemple concret

Optimisation d'un XGBoost pour la détection de fraude : Grid Search classique sur 5 paramètres 10 valeurs = 100 000 combinaisons (impossible). Optuna avec 200 essais en 2 heures : AUC = 0.94 avec learning_rate=0.05, max_depth=6, n_estimators=500. Grid Search sur le même espace : estimerait 3 semaines pour trouver mieux. Gain : 99%+ du temps économisé.

∑ Concept clé

Bayesian Optimization : Surrogate model (Gaussian Process ou Tree Parzen Estimator) + Acquisition function (Expected Improvement : EI(x) = E[max(f(x) - f(x+), 0)]). Optuna utilise TPE (Tree-structured Parzen Estimator).