Data Universe
Newsletter
GlossaireEEmbeddings
IA Générative

Embeddings

Définition

Représentation numérique dense d'un objet sémantique (texte, image, entité) dans un espace vectoriel à haute dimension (typiquement 768 à 3072 dimensions), où la proximité géométrique reflète la similarité sémantique. Un embedding capture la « signification » d'un texte indépendamment de ses mots exacts : « chien » et « canin » auront des vecteurs proches. Ils sont produits par les couches intermédiaires d'un modèle Transformer. En pratique, les embeddings sont la clé de voûte de la recherche sémantique (trouver des passages pertinents sans correspondance exacte), des systèmes RAG et de la classification de texte sans données étiquetées (zero-shot). La similarité cosinus est la métrique standard pour comparer deux embeddings.

Exemples concrets

text-embedding-3 (OpenAI)Sentence-BERTMistral Embed
← Retour au glossaireTermes en “E

Fiche rapide

CatégorieIA Générative
Exemples3 outils / technologies