OpenAI a sorti son dernier modèle, GPT-5.5, le 23 avril, juste une semaine après Anthropique introduit Claude Opus 4.7.
En tant que deux modèles phares des deux principaux laboratoires d’IA, nous voulions voir comment les nouveaux modèles se comparent.
Alerte spoiler : Nous pensons que Claude Opus 4.7 a un avantage en matière de codage avancé et agentique, mais GPT-5.5 est plus performant sur la plupart des benchmarks.
Anthropic dit que Claude Opus 4.7 a un taux d’honnêteté de 92%, moins de flagornerie
Vous souhaitez en savoir plus sur la façon de tirer le meilleur parti de votre technologie ? Inscrivez-vous à Mashable Newsletters Top Stories et Offres aujourd’hui.
GPT-5.5 et Opus 4.7 : classements
GPT-5.5 n’est pas encore classé dans tous les classements IA, mais il devrait être très compétitif avec Claude Opus 4.7. Dans les classements des tests de référence vérifiés tels que Prix ArcGPT-5.5 bat Opus 4.7 (plus de détails ci-dessous).
Sur le populaire Classement de l’arènebasé sur des tests utilisateurs, Claude Opus 4.7 Thinking occupe la première place du classement général. Il est intéressant de noter que l’Opus 4.7 est actuellement classé en dessous de l’Opus 4.6, même si cela changera probablement avec le temps. Actuellement, les nouveaux modèles Anthropic occupent les quatre premières places du classement général. De plus, Claude Mythos, un inédit d’Anthropic n’est pas classé, et Anthropic dit qu’il fonctionne encore mieux que l’Opus 4.7.
Sur le Indice de capacités d’époque (ECI) classement, GPT-5.4 Pro a le meilleur score pour le moment. (ECI combine plusieurs critères de référence en un seul score.) Vous trouverez Gémeaux 3.1 Pro et GPT-5.4 aux deuxième et troisième positions.
La capacité de l’IA à détecter les bogues logiciels majeurs augmente de 490 % d’année en année
GPT-5.5 et Opus 4.7 : benchmarks
Comment les nouveaux modèles se comportent-ils lors des tests de référence les plus courants ? Nous devons nous appuyer principalement sur les scores autodéclarés d’OpenAI et d’Anthropic pour ces tests. Ils obtiennent tous deux des notes élevées, comme on peut s’y attendre, mais GPT-5.5 a définitivement l’avantage.
Voici comment ils se comparent à certains des meilleurs tests de référence en matière d’IA :
Vitesse de la lumière écrasable
-
SWE-Bench Pro : GPT-5.5 a obtenu un score de 58,6 ; L’opus 4.7 a obtenu un score de 64,3 pour cent
-
Terminal-Bench 2.0 : GPT-5.5 a obtenu un score de 82,7 % ; L’opus 4.7 a obtenu un score de 69,4 pour cent
-
Le dernier examen de l’humanité : GPT-5.5 a obtenu un score de 40,6 % ; L’opus 4.7 a obtenu 31,2 pour cent*
-
Le dernier examen de l’humanité (avec outils) : GPT-5.5 a obtenu un score de 52,2 % ; L’opus 4.7 a obtenu 54,7 pour cent
-
ParcourirComp : GPT-5.5 a obtenu un score de 84,4 % ; L’opus 4.7 a obtenu un score de 79,3 pour cent
-
Diamant GPQA : GPT-5.5 a obtenu un score de 93,6 % ; L’opus 4.7 a obtenu un score de 94,2 pour cent
-
ARC-AGI-1 (Vérifié) : GPT-5.5 (Élevé) a obtenu un score de 94,5 % ; Claude 4,7 (Élevé) a obtenu 92 pour cent**
-
ARC-AGI-2 (Vérifié) : GPT-5.5 (Élevé) a obtenu un score de 83,3 % ; Claude 4,7 (Élevé) a obtenu 68,3 pour cent**
*Pour le dernier examen de l’humanité, nous citons Résultats HLE vérifiés par l’analyse artificielle. Notamment, Anthropic rapporte que l’Opus 4.7 a obtenu un score de 46,9 % à ce test.
**Voir les résultats complets sur Site du Prix Arc.
GPT 5.5 et Opus 4.7 : Disponibilité et tarifs
OpenAI affirme que GPT 5.5 est « notre modèle le plus intelligent et le plus intuitif à utiliser à ce jour ». Claude Opus 4.7 est le modèle Anthropic le plus avancé disponible pour les utilisateurs de Claude, bien qu’Anthropic affirme que le Claude Mythos Preview inédit est globalement le modèle le plus performant.
En tant que tel, seuls les abonnés payants peuvent accéder à ces modèles frontières.
GPT 5.5 n’est disponible que pour les utilisateurs d’OpenAI Plus, Pro, Business et Enterprise dans ChatGPT et Codex (désolé, utilisateurs de ChatGPT Go). Les utilisateurs Pro, Business et Enterprise peuvent également accéder à GPT-5.5 Pro, tandis que les clients Plus, Pro, Business et Enterprise peuvent accéder à GPT-5.5 Thinking.
OpenAI augmente les prix de GPT-5.5 dans son API, bien que la société affirme qu’elle est plus efficace en matière de jetons. Le prix de l’API commence à « 5 $ par million de jetons d’entrée et 30 $ par 1 million de jetons de sortie, avec une fenêtre contextuelle de 1 million ».
Opus 4.7 est disponible pour les clients Pro et Max ; via l’API, il est disponible pour « 5 $ par million de jetons d’entrée et 25 $ par million de jetons de sortie ».
GPT-5.5 et Opus 4.7 : ensemble de fonctionnalités
OpenAI affirme que GPT-5.5 apporte des améliorations notables dans « le codage agent, l’utilisation de l’ordinateur, le travail de connaissances et les premières recherches scientifiques ». Anthropic affirme que Claude Opus 4.7 améliore le codage avancé, l’intelligence visuelle et l’analyse de documents.
ChatGPT et Claude ont des ensembles de fonctionnalités globales similaires, à quelques exceptions près. D’une manière générale, vous pouvez utiliser ces deux chatbots IA pour la recherche, le codage, les projets créatifs et le travail professionnel quotidien. Vous pouvez également utiliser les deux nouveaux modèles d’OpenAI et des plateformes de codage d’Anthropic, Codex et Claude Code.
Il est plus facile de parler des différences que des similitudes. Bien que GPT-5.5 ne soit pas un modèle d’image, dans ChatGPT, vous pouvez utiliser le nouveau Modèle ChatGPT Images 2.0. Anthropic récemment déployé Claude Conceptionmais il propose uniquement des visualisations de données, des graphiques et des diapositives, et non la génération d’images complètes. Ainsi, si vous avez besoin de générer des images ou des graphiques interactifs pour un projet, GPT-5.5 disposera de plus d’outils disponibles.

GPT-5.5 peut être utilisé pour créer des visualisations de données complexes et interactives.
Crédit : OpenAI
ChatGPT propose davantage d’intégrations d’applications et d’achats, mais grâce à son acquisition récente d’OpenClawAnthropic a l’avantage sur les capacités agentiques.
TL;DR : Si nous devions choisir l’un de ces modèles pour le travail professionnel quotidien, GPT-5.5 aurait l’avantage grâce à l’ensemble plus large des fonctionnalités de ChatGPT. Cependant, pour le codage avancé et agentique, nous opterions pour Claude Opus 4.7.
Divulgation : Ziff Davis, la société mère de Mashable, a déposé en avril 2025 une action en justice contre OpenAI, alléguant qu’elle avait violé les droits d’auteur de Ziff Davis dans la formation et l’exploitation de ses systèmes d’IA.
