Data Universe
Newsletter
Accueil/Encyclopédie/RAG — Retrieval-Augmented Generation
🔍Machine LearningAvancéIA Générative

RAG — Retrieval-Augmented Generation

Architecture qui augmente un LLM en lui donnant accès à une base documentaire externe au moment de la génération, pour réduire les hallucinations et ancrer les réponses dans des faits.

💡Explication simple

Un LLM comme GPT-4 connaît tout ce qu'on lui a appris pendant son entraînement, mais pas tes documents internes. RAG, c'est lui donner un accès en temps réel à ta bibliothèque : quand tu poses une question, le système recherche d'abord les passages pertinents dans tes documents, les montre au LLM, et lui dit « réponds en t'appuyant sur ces extraits ». Le LLM ne parle plus de mémoire, il lit avant de répondre.

🏗️Exemple concret

Un cabinet d'avocats dispose de 15 000 contrats. Avec RAG : la question 'Quelle est la clause de résiliation du contrat Acme ?' déclenche une recherche vectorielle qui retrouve les 5 passages les plus similaires dans les contrats, les injecte dans le prompt GPT-4, qui répond avec citation exacte. Précision validée : 91%.

∑ Concept clé

Pipeline RAG : Query → Embedding de la question → Recherche vectorielle (top-K chunks) → Augmentation du prompt (context + question) → LLM → Réponse avec sources

🎯Quand l'utiliser ?

Question-réponse sur documents internes confidentiels
Chatbot de support technique avec documentation produit
Assistance réglementaire (contrats, lois, normes)

✅ Avantages

+Réduit drastiquement les hallucinations (ancre dans les faits)
+Pas besoin de fine-tuner le LLM (moins coûteux)
+Sources citables et auditables

⚠️ Limites

Qualité dépend de la stratégie de chunking et de retrieval
Latence additionnelle (recherche + génération)
Peut rater des informations si le retrieval est imprécis

🛠️ Outils principaux

LangChain
LlamaIndex
ChromaDB / Pinecone / Qdrant (vector stores)
Databricks Vector Search
Azure AI Search
LLMIA GénérativeNLPVector SearchChatbot

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie