Data Universe
Newsletter
Accueil/Encyclopédie/BERT — Représentations bidirectionnelles
🤖Machine LearningAvancéNLP

BERT — Représentations bidirectionnelles

Modèle NLP pré-entraîné de Google qui comprend le contexte bidirectionnel des phrases. La base de la plupart des systèmes de compréhension de texte modernes.

💡Explication simple

Les anciens modèles NLP lisaient de gauche à droite. BERT lit le mot 'banque' en regardant à la fois les mots qui le précèdent ET ceux qui le suivent, en même temps. C'est ce 'bidirectionnel' qui lui permet de comprendre la désambiguïsation contextuelle. BERT est pré-entraîné sur Wikipedia et BooksCorpus : il comprend déjà le langage. On le fine-tune ensuite sur sa tâche spécifique avec peu de données.

🏗️Exemple concret

Extraction d'entités nommées dans des contrats : BERT fine-tuné sur 5 000 contrats annotés identifie les parties, montants, dates et clauses clés avec une précision de 94% F1. CamemBERT (BERT en français) extrait les indicateurs ESG de rapports annuels avec 87% de précision, là où BERT anglais plafonnait à 71% sur les textes français.

∑ Concept clé

Pré-entraînement : MLM (Masked Language Modeling : prédire les mots masqués) + NSP (Next Sentence Prediction). Fine-tuning : ajouter une tête de classification sur le token [CLS].

🎯Quand l'utiliser ?

Classification de texte (sentiment, intention)
Extraction d'entités nommées (NER)
Question-réponse sur documents

✅ Avantages

+Excellent en few-shot : fine-tuning avec 1 000 exemples donne de bons résultats
+Modèles multilingues (mBERT, XLM-R)
+Encodeur idéal pour les embeddings sémantiques

⚠️ Limites

Encodeur seulement (pas de génération de texte — utiliser GPT pour ça)
Fenêtre de contexte limitée à 512 tokens (vs 128K pour GPT-4)
Supplanté par des modèles plus récents (DeBERTa, RoBERTa) pour la performance

🛠️ Outils principaux

HuggingFace Transformers (bert-base-french-cased, CamemBERT)
sentence-transformers (embeddings BERT)
LangChain (intégration BERT embeddings)
NLPDeep LearningEmbeddingsTransfer LearningTexte

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie