Computer Vision

Définition

Domaine de l'IA qui permet aux machines d'interpréter et comprendre le contenu visuel (images, vidéos). Les tâches fondamentales sont la classification d'images (quelle catégorie ?), la détection d'objets (où sont-ils ?), la segmentation sémantique (pixel par pixel) et la reconnaissance de caractères (OCR). Les CNNs ont dominé le domaine jusqu'en 2021 ; les Vision Transformers (ViT) offrent de meilleures performances sur les grands datasets. Les modèles de diffusion (Stable Diffusion, DALL-E, Midjourney) ont révolutionné la génération d'images. Les applications pratiques incluent le contrôle qualité industriel, la surveillance, la conduite autonome, l'imagerie médicale et la réalité augmentée.

Exemples concrets

YOLO (détection)ResNet (classification)Stable Diffusion (génération)OCR Tesseract

← Retour au glossaire Termes en “C”

Fiche rapide

CatégorieDeep Learning

Exemples4 outils / technologies

Autres termes en Deep Learning

Attention Mechanism →Backpropagation →BERT →CNN (Réseau de Neurones Convolutif) →Diffusion Model →