Domaine de l'IA qui permet aux machines d'interpréter et comprendre le contenu visuel (images, vidéos). Les tâches fondamentales sont la classification d'images (quelle catégorie ?), la détection d'objets (où sont-ils ?), la segmentation sémantique (pixel par pixel) et la reconnaissance de caractères (OCR). Les CNNs ont dominé le domaine jusqu'en 2021 ; les Vision Transformers (ViT) offrent de meilleures performances sur les grands datasets. Les modèles de diffusion (Stable Diffusion, DALL-E, Midjourney) ont révolutionné la génération d'images. Les applications pratiques incluent le contrôle qualité industriel, la surveillance, la conduite autonome, l'imagerie médicale et la réalité augmentée.