Tâche NLP qui identifie et classifie automatiquement les entités nommées dans un texte : personnes (PER), organisations (ORG), lieux (LOC), dates (DATE), montants (MONEY) et d'autres types définis selon le domaine. Le NER est la fondation de nombreux pipelines d'extraction d'information : analyser des contrats pour en extraire les parties, les dates d'échéance et les montants ; enrichir une base CRM à partir d'articles de presse ; structurer des dossiers médicaux. Les modèles modernes basés sur BERT (BioBERT pour le médical, CamemBERT pour le français) atteignent des performances proches de l'humain sur les benchmarks standards.