LSTM (Long Short-Term Memory)

Définition

Architecture de réseau récurrent qui résout le vanishing gradient des RNN en introduisant une mémoire cellulaire (cell state) et trois portes (gates) qui régulent sélectivement le flux d'information : la porte d'oubli (forget gate — décide quoi effacer de la mémoire), la porte d'entrée (input gate — décide quoi ajouter), et la porte de sortie (output gate — décide quoi exposer comme état caché). Cette architecture permet de mémoriser des dépendances sur des centaines de pas de temps. Introduite par Hochreiter et Schmidhuber en 1997, LSTM a dominé le NLP, la reconnaissance vocale et la prédiction de séries temporelles jusqu'à l'émergence des Transformers. Reste pertinent pour les séquences de données structurées, le traitement en temps réel sur edge devices, et les cas où les Transformers sont trop lourds.

Exemples concrets

LSTM Keras pour séries temporellesBiLSTM pour NLPLSTM speech recognitionPrédiction de stocks financiers

← Retour au glossaire Termes en “L”

Fiche rapide

CatégorieDeep Learning

Exemples4 outils / technologies

Autres termes en Deep Learning

Attention Mechanism →Backpropagation →BERT →CNN (Réseau de Neurones Convolutif) →Computer Vision →