LlamaIndex (anciennement GPT Index) est le framework Python spécialisé dans le RAG (Retrieval-Augmented Generation) et l'indexation de données pour les LLMs. Là où LangChain est généraliste, LlamaIndex excelle sur tout ce qui touche à la structuration et l'interrogation de documents. Il couvre les loaders de données (150+ types), le chunking avancé, les stratégies d'indexation et de requêtes.
Ingestion et indexation de corpus documentaire
LlamaIndex automatise le chargement, le découpage (chunking), l'embedding et l'indexation de documents depuis des dizaines de sources (PDF, Notion, Slack, bases de données) pour alimenter des applications RAG.
Construction d'agents IA avec outils
LlamaIndex permet de construire des agents capables d'utiliser des outils (recherche vectorielle, API externes, calculatrices) et de raisonner en plusieurs étapes pour répondre à des questions complexes.
Q&A sur données structurées et non structurées
LlamaIndex propose des abstractions pour interroger simultanément des tables SQL et des documents non structurés, permettant à un LLM de générer et d'exécuter des requêtes sur les deux types de sources.
Évaluation et observabilité des pipelines RAG
LlamaIndex inclut des modules d'évaluation (Ragas-compatible) et d'instrumentation permettant de mesurer la qualité des réponses générées et d'identifier les goulots d'étranglement du pipeline.
✓ Points forts
✗ Limites
✓ Fait pour vous si…
Applications RAG sur documents complexes, pipelines d'indexation de données structurées/non structurées pour LLMs.
✗ Pas fait pour vous si…
Applications LLM simples sans RAG (utiliser directement l'API). Équipes déjà fortement investies sur LangChain.
Building Agentic RAG with LlamaIndex
MOOCDeepLearning.AI
LlamaIndex Documentation
DocumentationLlamaIndex
LlamaIndex: Building RAG Applications
MOOCUdemy