Data Universe
Newsletter
GlossaireVVector Database
Infrastructure

Vector Database

Définition

Base de données spécialisée dans le stockage et la recherche par similarité de vecteurs d'embeddings haute dimension. La recherche exhaustive (comparer le vecteur requête à tous les vecteurs du catalogue) est trop lente pour des collections de millions d'entrées ; les vector databases utilisent des index ANN (Approximate Nearest Neighbor) comme HNSW ou IVFFlat pour trouver les k voisins les plus proches en millisecondes avec une légère perte de rappel. Pilier des architectures RAG, elles stockent les embeddings de documents découpés en chunks et les retrouvent à la vitesse nécessaire à l'inférence. Les fonctionnalités de filtering par métadonnées et de hybrid search (vectoriel + lexical) sont devenues indispensables en production.

Exemples concrets

PineconeWeaviateQdrantpgvectorChroma
← Retour au glossaireTermes en “V

Fiche rapide

CatégorieInfrastructure
Exemples5 outils / technologies