Data Universe
Newsletter
Accueil/Encyclopédie/Base de données vectorielle
🗄️Machine LearningIntermédiaireIA Générative

Base de données vectorielle

Base de données spécialisée dans le stockage et la recherche par similarité de vecteurs numériques représentant des textes, images ou sons.

💡Explication simple

Dans une base SQL, tu cherches par valeur exacte ('WHERE nom = Dupont'). Dans une base vectorielle, tu cherches par similarité sémantique : « trouve-moi les 5 textes qui ressemblent le plus à cette phrase ». Chaque document est transformé en un vecteur de 1536 nombres (un embedding). La base compare ces vecteurs géométriquement — les textes similaires ont des vecteurs proches dans l'espace.

🏗️Exemple concret

Moteur de recherche d'articles data : l'article 'XGBoost pour la détection de fraude' est encodé en vecteur. La recherche 'algorithme pour détecter les anomalies financières' trouve cet article en top 1 malgré aucun mot en commun — parce que les sens sont proches.

∑ Concept clé

Similarité cosinus : cos(θ) = (A·B) / (||A|| × ||B||). HNSW (Hierarchical Navigable Small World) : algorithme d'indexation permettant la recherche approximative du voisin le plus proche en O(log n).

🎯Quand l'utiliser ?

Recherche sémantique (moteur de recherche IA)
Composante retrieval d'une architecture RAG
Recommandation par similarité de contenu

✅ Avantages

+Recherche par sens, pas par mots-clés exacts
+Haute performance sur des millions de vecteurs (ANN)
+Compatible avec tous les types de données embarquables

⚠️ Limites

Nécessite de générer les embeddings au préalable (coût API)
Pas de requêtes relationnelles classiques (pas de JOIN SQL)
Gestion des mises à jour (reindexation nécessaire)

🛠️ Outils principaux

Pinecone
ChromaDB (open source)
Qdrant
Weaviate
Databricks Vector Search
pgvector (PostgreSQL)
Vector SearchEmbeddingsRAGIA GénérativeSimilarité

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie