Représentation numérique dense d'un objet sémantique (texte, image, entité) dans un espace vectoriel à haute dimension (typiquement 768 à 3072 dimensions), où la proximité géométrique reflète la similarité sémantique. Un embedding capture la « signification » d'un texte indépendamment de ses mots exacts : « chien » et « canin » auront des vecteurs proches. Ils sont produits par les couches intermédiaires d'un modèle Transformer. En pratique, les embeddings sont la clé de voûte de la recherche sémantique (trouver des passages pertinents sans correspondance exacte), des systèmes RAG et de la classification de texte sans données étiquetées (zero-shot). La similarité cosinus est la métrique standard pour comparer deux embeddings.