Deep Learning

BERT

Définition

Bidirectional Encoder Representations from Transformers — modèle de langage pré-entraîné par Google (2018) qui a révolutionné le NLP. Contrairement aux LM unidirectionnels (GPT), BERT est pré-entraîné de façon bidirectionnelle via deux tâches : Masked Language Modeling (prédire des tokens masqués au milieu d'une phrase, forçant la compréhension du contexte gauche ET droit) et Next Sentence Prediction. BERT produit des embeddings contextuels : le même mot a des représentations différentes selon son contexte. Il se fine-tune en ajoutant une simple couche de classification sur le token [CLS] pour des tâches downstream (classification, NER, QA). RoBERTa, CamemBERT (français), DistilBERT (version légère) sont des variantes améliorées. Les modèles de la famille BERT restent le choix par défaut pour les tâches de compréhension textuelle.

Exemples concrets

CamemBERT (français)RoBERTaDistilBERTFine-tuning BERT pour NER

← Retour au glossaire Termes en “B”

Fiche rapide

CatégorieDeep Learning

Exemples4 outils / technologies

Autres termes en Deep Learning

Attention Mechanism →Backpropagation →CNN (Réseau de Neurones Convolutif) →Computer Vision →Diffusion Model →