Data Universe
Newsletter
Accueil/Encyclopédie/Transformers et LLMs
🤖Machine LearningAvancéDeep Learning

Transformers et LLMs

L'architecture qui a révolutionné le NLP et propulsé ChatGPT. Les Transformers comprennent le contexte d'une phrase en regardant tous les mots en même temps.

💡Explication simple

Quand tu lis « La banque est fermée », tu comprends instantanément que 'banque' = institution financière et pas rive de rivière grâce au contexte. Les anciens modèles lisaient mot par mot. Les Transformers regardent tous les mots en même temps et calculent comment chaque mot est lié à tous les autres (mécanisme d'attention). C'est pourquoi ils comprennent le sens.

🏗️Exemple concret

GPT-4 est un LLM (Large Language Model) basé sur l'architecture Transformer, entraîné sur des milliards de pages web. Il peut rédiger du code, traduire, analyser des contrats, répondre à des questions complexes. BERT (Google) est utilisé pour la recherche sémantique : il comprend que 'voiture' et 'automobile' sont synonymes.

∑ Concept clé

Attention(Q,K,V) = softmax(QKᵀ/√d_k) · V — le mécanisme d'attention calcule un score entre chaque paire de mots

🎯Quand l'utiliser ?

NLP : génération de texte, classification, extraction d'info
Question-réponse sur documents
Code generation, traduction

✅ Avantages

+Comprend le contexte à longue distance
+Transfer Learning : un modèle pré-entraîné se fine-tune rapidement
+Polyvalent : texte, image, code, audio

⚠️ Limites

Très coûteux à entraîner (millions de dollars)
Hallucinations possibles
Difficile à contrôler et auditer

🛠️ Outils principaux

Hugging Face Transformers
OpenAI API
Anthropic Claude
Google Gemini
LangChain
Deep LearningNLPLLMIA GénérativeGPTBERT

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie