Gradient Descent

Définition

Algorithme d'optimisation qui minimise itérativement une fonction de coût (loss) en calculant le gradient par rapport aux paramètres du modèle et en les ajustant dans la direction opposée au gradient, proportionnellement au learning rate. C'est le mécanisme fondamental d'entraînement de tous les réseaux de neurones. La variante stochastique (SGD) calcule le gradient sur un mini-batch de données plutôt que sur l'ensemble, ce qui accélère l'entraînement et peut aider à échapper aux minima locaux. L'optimiseur Adam, qui adapte le learning rate par paramètre en tenant compte des gradients passés, est aujourd'hui le standard pour la plupart des tâches deep learning.

Exemples concrets

SGD (Stochastic Gradient Descent)Adam optimizerRMSprop

← Retour au glossaire Termes en “G”

Fiche rapide

CatégorieMachine Learning

Exemples3 outils / technologies

Autres termes en Machine Learning

Anomaly Detection →AutoML →Bagging (Bootstrap Aggregating) →Bias-Variance Tradeoff →Class Imbalance →