Base de données spécialisée dans le stockage et la recherche par similarité de vecteurs d'embeddings haute dimension. La recherche exhaustive (comparer le vecteur requête à tous les vecteurs du catalogue) est trop lente pour des collections de millions d'entrées ; les vector databases utilisent des index ANN (Approximate Nearest Neighbor) comme HNSW ou IVFFlat pour trouver les k voisins les plus proches en millisecondes avec une légère perte de rappel. Pilier des architectures RAG, elles stockent les embeddings de documents découpés en chunks et les retrouvent à la vitesse nécessaire à l'inférence. Les fonctionnalités de filtering par métadonnées et de hybrid search (vectoriel + lexical) sont devenues indispensables en production.