Weaviate est une base de données vectorielle open source qui combine stockage vectoriel et objet dans un seul système. Sa différence : les modules IA intégrés (text2vec-openai, text2vec-huggingface...) permettent de vectoriser automatiquement les données à l'ingestion. Alternative open source et self-hostable à Pinecone.
Recherche hybride texte + vecteur
Weaviate combine la recherche par similarité vectorielle et la recherche par mots-clés BM25 dans une même requête, permettant des résultats plus pertinents qu'une approche purement vectorielle.
Base de connaissances multimodale
Weaviate stocke et indexe simultanément du texte, des images et d'autres types de données avec leurs embeddings, permettant des recherches cross-modales comme retrouver des images à partir d'une description textuelle.
Pipeline RAG avec modules d'inférence intégrés
Les modules natifs de Weaviate (text2vec, generative) permettent de générer des embeddings et d'appeler des LLMs directement depuis la base de données, simplifiant l'architecture des applications RAG.
Gestion de graphes de connaissances vectoriels
Weaviate supporte les références entre objets, permettant de modéliser des entités liées (documents, auteurs, tags) tout en conservant les capacités de recherche vectorielle sur chaque noeud.
✓ Points forts
✗ Limites
✓ Fait pour vous si…
Applications RAG nécessitant de la souveraineté des données ou un self-hosting. Multi-tenancy, ingestion automatique d'embeddings.
✗ Pas fait pour vous si…
Équipes voulant le moins de friction possible (Pinecone plus simple à démarrer). Très grands volumes sans expertise ops.
Weaviate Academy
Formation officielleWeaviate
Building Applications with Vector Databases
MOOCDeepLearning.AI
Weaviate Documentation
DocumentationWeaviate