Note sur les benchmarks : Les scores affichés proviennent des annonces officielles des éditeurs. Les méthodologies varient (pass@1, avec/sans outils, prompts différents) — les comparaisons inter-éditeurs sont indicatives. Les prix sont vérifiés mais évoluent fréquemment ; consultez les pages tarifaires officielles pour les valeurs actuelles.
Anthropic
2026-05
Claude Opus 4.8
Modèle phare d'Anthropic sorti le 28 mai 2026, 41 jours après Opus 4.7. Introduit les 'dynamic workflows' dans Claude Code pour les tâches à très grande échelle. Score de 61.4 sur l'Artificial Analysis Intelligence Index (+4.1 vs 4.7), le meilleur tous modèles confondus. Vitesse 2,5x via le fast mode, 3x moins cher que sur la génération précédente.
Google DeepMind
2026-05
Gemini 3.5 Flash
Modèle actuel de référence de Google pour les agents et le code. Offre des performances de niveau frontier à 4x la vitesse des modèles comparables. Contexte 1M tokens, optimisé pour les tâches longues horizon et les pipelines agentiques complexes.
OpenAI
2026-04
GPT-5.5
Dernière version du flagship OpenAI, sortie le 23 avril 2026. Fenêtre contextuelle portée à 400K tokens, raisonnement complexe amélioré. Score de 60.2 sur l'Artificial Analysis Intelligence Index — légèrement en dessous de Claude Opus 4.8 (61.4). Disponible en version standard et frontier.
Google DeepMind
2026-02
Gemini 3.1 Pro
Sorti le 19 février 2026, Gemini 3.1 Pro double les performances de raisonnement de Gemini 3 Pro. Classé numéro 1 sur 12 des 18 benchmarks suivis à sa sortie, avec 1M tokens de contexte et 65K tokens de sortie maximum. Meilleur modèle Google pour les tâches de raisonnement complexe.
Anthropic
2025-10
Claude Haiku 4.5
Modèle ultra-rapide et économique de la famille Claude 4.x, sorti en octobre 2025. Représente un bond qualitatif majeur par rapport à Claude 3 Haiku, avec des capacités proches de Claude 3.5 Sonnet pour une fraction du coût. Idéal pour les pipelines haute fréquence.
Anthropic
2025-05
Claude Sonnet 4.6
Le modèle principal de la famille Claude 4.x, et le modèle qui fait tourner Claude Code. Combine raisonnement hybride (rapide et étendu), très haute performance sur le code et les tâches agentiques, avec un coût nettement inférieur à Opus. Référence du marché pour les applications production.
Mistral AI
2025-05
Mistral Medium 3
Modèle intermédiaire de Mistral positionnée entre Small 3 et Large 2. Optimisé pour les tâches d'entreprise avec un rapport coût/performance compétitif. Déployable en cloud Mistral ou on-premise via la licence commerciale.
OpenAI
2025-04
o3
Modèle de raisonnement de pointe d'OpenAI utilisant le chain-of-thought étendu pour résoudre des problèmes complexes. Excelle en mathématiques, sciences et programmation avancée. Note : o3 Deep Research (variante avec recherche web approfondie) a un pricing différent à $10/$40 par M tokens.
OpenAI
2025-04
o4-mini
Successeur de o3-mini (disponible depuis avril 2025), modèle de raisonnement compact et économique. Améliore o3-mini sur la vision, le code et le raisonnement multiétape. Disponible via l'API OpenAI en remplacement de o3-mini.
Meta
2025-04
Llama 4 Scout
Premier modèle de la famille Llama 4 de Meta, avec architecture Mixture of Experts (MoE). 17B paramètres actifs pour 109B au total. Fenêtre contextuelle record de 10 millions de tokens, optimisé pour le déploiement local et cloud.
Meta
2025-04
Llama 4 Maverick
Modèle phare de la famille Llama 4, avec 128 experts MoE et 17B paramètres actifs pour 400B au total. Concurrent direct de GPT-4o et Claude 3.5 Sonnet sur la plupart des benchmarks, avec l'avantage d'être open source.
Mistral AI
2025-03
Mistral Small 3.1
Modèle compact de 24 milliards de paramètres de Mistral AI (version 3.1 de mars 2025), conçu pour les déploiements edge et les applications nécessitant faible latence. Support multimodal (images) et fenêtre de contexte portée à 128K tokens vs 32K pour la version 3.0 initiale.
Google DeepMind
2025-03
Gemini 2.5 Pro
Le modèle phare de Google intégrant un mécanisme de réflexion interne (thinking). Domine les benchmarks de raisonnement et de code en mars 2025, avec une fenêtre contextuelle d'1 million de tokens. Multimodal natif (texte, image, audio, vidéo).
xAI
2025-02
Grok 3
Le modèle phare d'Elon Musk's xAI, entraîné sur 100k GPU H100. Accès exclusif via abonnement Premium+ X (ex-Twitter). Intègre le mode 'Think' pour le raisonnement étendu et l'accès temps réel aux données de X.
Google DeepMind
2025-01
Gemini 2.0 Flash
⚠️ Retiré le 1er juin 2026 — remplacé par Gemini 2.5 Flash. Sorti le 30 janvier 2025 comme modèle par défaut de l'API Google. Modèle multimodal rapide, successeur de Gemini 1.5 Flash. Conçu pour les applications temps réel avec support audio, vidéo, image et texte.
DeepSeek
2025-01
DeepSeek R1
Modèle de raisonnement open source de DeepSeek, concurrent direct de o1 d'OpenAI. Utilise le renforcement pur sans supervised fine-tuning initial pour développer des capacités de raisonnement émergentes. Performances remarquables sur les benchmarks STEM.
Meta
2024-12
Llama 3.3 70B
Meilleure version de Llama 3 dans la taille 70B, offrant des performances comparables à des modèles bien plus grands. Librement téléchargeable et déployable on-premise. Référence absolue de l'open source pour son ratio taille/performance.
DeepSeek
2024-12
DeepSeek V3
Modèle MoE de 671B paramètres (37B actifs) entraîné pour moins de 6 millions de dollars selon DeepSeek, provoquant une onde de choc dans le secteur IA. Performances comparables à GPT-4o et Claude 3.5 Sonnet sur les benchmarks majeurs.
Microsoft
2024-12
Phi-4
Petit modèle de 14 milliards de paramètres de Microsoft qui surpasse des modèles bien plus grands sur les benchmarks quantitatifs. Entraîné principalement sur des données synthétiques de haute qualité. Disponible sur Azure AI Foundry et Hugging Face.
OpenAI
2024-12
Sora
Modèle de génération vidéo d'OpenAI, annoncé en février 2024 et lancé fin 2024. Capable de générer des vidéos jusqu'à 60 secondes en haute définition à partir de prompts textuels ou d'images. Basé sur une architecture diffusion transformer.
Mistral AI
2024-11
Pixtral Large
Premier modèle multimodal de Mistral AI, basé sur Mistral Large 2 avec un encodeur visuel dédié. Capable d'analyser plusieurs images simultanément et de résoudre des problèmes visuels complexes. Disponible via La Plateforme Mistral.
Kuaishou
2024-11
Kling 1.6
Modèle de génération vidéo de Kuaishou (géant chinois de la vidéo courte), reconnu pour la cohérence physique et la qualité des mouvements humains. Disponible via API ou interface web avec des plans compétitifs.
Stability AI
2024-10
Stable Diffusion 3.5
Dernier modèle de la famille Stable Diffusion, le pionnier de la génération d'images open source. Architecture Multimodal Diffusion Transformer. Entièrement personnalisable et déployable localement, avec un vaste écosystème de fine-tunes et de LoRA.
Black Forest Labs
2024-10
FLUX 1.1 Pro
Modèle de génération d'images de Black Forest Labs, fondé par les créateurs originaux de Stable Diffusion. Offre une qualité photographique et une cohérence exceptionnelles. Reconnu comme l'un des modèles les plus performants sur les benchmarks d'évaluation humaine.
Suno
2024-10
Suno v4
Modèle de génération musicale de référence, capable de créer des chansons complètes (paroles, mélodie, voix) à partir d'un simple prompt textuel. Suno v4 améliore la qualité audio, la cohérence des paroles et la diversité des styles musicaux.
Ideogram
2024-09
Ideogram 2.0
Modèle de génération d'images spécialisé dans la génération de texte lisible et cohérent au sein des visuels. Résout le problème historique des modèles qui produisaient du texte illisible. Idéal pour les visuels marketing, affiches et infographies.
OpenAI
2023-10
DALL-E 3
⚠️ Retiré de l'API OpenAI le 12 mai 2026 — remplacé par GPT Image 1 (gpt-image-1). DALL-E 3 reste accessible via ChatGPT mais n'est plus disponible via l'API. Modèle historique d'OpenAI avec une excellente compréhension des prompts complexes grâce à une phase de recaptioning par GPT-4.
Cursor AI
2023-03
Cursor
IDE IA-first basé sur VS Code, permettant des interactions naturelles avec la base de code entière. Cursor Chat permet de modifier des fichiers entiers via instructions en langage naturel. Adopté massivement par les développeurs solo et les startups pour sa productivité.
ElevenLabs
2023-01
ElevenLabs TTS
Plateforme de synthèse vocale ultra-réaliste, référence du marché. Le modèle flagship Eleven v3 (février 2026) supporte 70+ langues avec contrôle émotionnel avancé via audio tags. Flash v2.5 (32 langues) cible les applications temps-réel basse-latence. Plans : Free (10 000 crédits/mois ≈ 10 min), Starter ($5/mois), Creator ($22/mois), Pro ($99/mois).
Microsoft / GitHub
2022-06
GitHub Copilot
Assistant de codage IA le plus adopté en entreprise, avec 4,7M+ abonnés payants (jan. 2026) et disponible pour tous les développeurs GitHub (plan gratuit inclus). Intégré nativement à VS Code, JetBrains, Visual Studio et Neovim. Powered par des modèles d'OpenAI et Anthropic, avec Copilot Chat pour les conversations contextuelles.