Data Universe
Newsletter
GlossaireCComputer Vision
Deep Learning

Computer Vision

Définition

Domaine de l'IA qui permet aux machines d'interpréter et comprendre le contenu visuel (images, vidéos). Les tâches fondamentales sont la classification d'images (quelle catégorie ?), la détection d'objets (où sont-ils ?), la segmentation sémantique (pixel par pixel) et la reconnaissance de caractères (OCR). Les CNNs ont dominé le domaine jusqu'en 2021 ; les Vision Transformers (ViT) offrent de meilleures performances sur les grands datasets. Les modèles de diffusion (Stable Diffusion, DALL-E, Midjourney) ont révolutionné la génération d'images. Les applications pratiques incluent le contrôle qualité industriel, la surveillance, la conduite autonome, l'imagerie médicale et la réalité augmentée.

Exemples concrets

YOLO (détection)ResNet (classification)Stable Diffusion (génération)OCR Tesseract
← Retour au glossaireTermes en “C

Fiche rapide

CatégorieDeep Learning
Exemples4 outils / technologies