Data Universe
Newsletter
Accueil/Encyclopédie/Descente de gradient
⛷️Machine LearningIntermédiaireOptimisation ML

Descente de gradient

Algorithme d'optimisation fondamental qui ajuste itérativement les paramètres d'un modèle pour minimiser l'erreur, en suivant la pente de la fonction de perte.

💡Explication simple

Imagine que tu es sur une montagne dans le brouillard et tu veux descendre dans la vallée (minimiser l'erreur). À chaque pas, tu tâtes le sol autour de toi et tu avances dans la direction où la pente descend le plus. C'est la descente de gradient : à chaque itération (epoch), on calcule dans quelle direction modifier les paramètres pour réduire l'erreur. Le 'learning rate' contrôle la taille de chaque pas.

🏗️Exemple concret

Entraînement d'un réseau de neurones pour la reconnaissance d'images : à chaque batch de 32 images, on calcule l'erreur, puis le gradient (dérivée partielle de l'erreur par rapport à chaque poids). On ajuste les 50 millions de poids d'un petit pas (learning rate = 0.001). Après 100 000 étapes, l'erreur a convergé.

∑ Concept clé

θ_t+1 = θ_t - α × ∇L(θ_t), où α est le learning rate et ∇L le gradient de la fonction de perte

🎯Quand l'utiliser ?

Entraînement de tous les modèles paramétriques (réseaux de neurones, régression)
Optimisation de fonctions différentiables
Au cœur de tous les algorithmes ML modernes

✅ Avantages

+Converge vers un minimum local (global si la fonction est convexe)
+Scalable à de très grands datasets (SGD, mini-batch)
+Base de toutes les variantes modernes (Adam, RMSProp)

⚠️ Limites

Peut rester bloqué dans des minima locaux
Sensible au learning rate (trop grand = divergence, trop petit = lent)
SGD peut osciller autour du minimum

🛠️ Outils principaux

TensorFlow/Keras (optimizers)
PyTorch (torch.optim)
Scikit-learn (SGDClassifier)
MLOptimisationDeep LearningFondamentaux

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie