ChromaDB est la base de données vectorielle la plus simple à utiliser pour démarrer un projet RAG en Python. Quelques lignes de code, zero config, persistance locale ou en mémoire. Idéale pour le prototypage et les projets de taille modérée. S'intègre parfaitement avec LangChain et LlamaIndex.
Prototypage rapide d'applications RAG
ChromaDB est souvent le premier choix pour prototyper des pipelines RAG grâce à son installation en une ligne (pip install chromadb) et son mode in-memory, sans infrastructure à déployer.
Stockage d'embeddings pour chatbots documentaires
Les développeurs utilisent ChromaDB pour indexer les chunks d'un corpus de documents PDF ou web, puis retrouver les passages pertinents à chaque question posée au chatbot.
Expérimentation locale de recherche vectorielle
ChromaDB permet aux data scientists d'expérimenter différentes stratégies d'embedding et de chunking en local avant de migrer vers une solution cloud comme Pinecone pour la production.
Persistance d'embeddings dans des applications LangChain / LlamaIndex
ChromaDB s'intègre nativement comme vector store dans LangChain et LlamaIndex, permettant de persister les collections d'embeddings entre les sessions de développement.
✓ Points forts
✗ Limites
✓ Fait pour vous si…
Prototypage RAG, cours et tutoriels, applications locales ou petite échelle. Point de départ avant de migrer vers Pinecone ou Weaviate.
✗ Pas fait pour vous si…
Applications production à grande échelle. Multi-tenancy. Équipes sans ressources pour gérer l'infra.
ChromaDB Documentation
DocumentationChroma
LangChain & Vector Stores
Formation officielleLangChain Academy
Building RAG Applications
MOOCDeepLearning.AI