GPT-5.4 Pro atteint 150 IQ lors du test MESNA en Norvège alors qu'OpenAI bat son propre record

Faites CryptoSlate préféré sur

Le dernier modèle GPT-5.4 Pro d’OpenAI a désormais atteint un score IQ supérieur à 99,96 % de tous les êtres humains, donnant aux marchés un signal nouveau indiquant que les progrès des capacités de l’IA commencent à dépasser le bruit habituel du cycle produit.

Le GPT-5.4 Pro d’OpenAI touche 150 sur un benchmark public d’IQ alors que les marchés entrent dans une autre semaine riche en données macro

Le classement public de TrackingAI place désormais OpenAI GPT-5.4 Pro à un score d’IQ de 150, un bond net par rapport au score de 136 que le modèle o3 d’OpenAI avait publié sur le test Mensa Norway l’année dernière.

Le saut arrive à un moment où l’attention du marché s’est resserrée autour de l’Iran, de l’énergie, de la faiblesse de l’emploi, et de la prochaine publication de l’inflation. Cela pose une question différente pour la semaine à venir : à quelle vitesse l’intelligence machine s’accumule-t-elle, et quand cette accélération commencera-t-elle à chevaucher le positionnement économique ?

Pourquoi c’est important : Un passage de 136 à 150 sur un benchmark largement compris comprime un changement de capacité complexe en un simple signal. Pour les entreprises, ce signal alimente directement les décisions concernant l’automatisation, les budgets logiciels et la planification des effectifs. Pour les marchés, il ajoute une variable de plus aux côtés des taux, de l’inflation et des attentes de croissance.

OpenAI a présenté GPT-5.4 comme son modèle le plus capable et le plus efficace pour le travail professionnel, avec un meilleur codage, une meilleure utilisation d’outils et d’ordinateurs, et une fenêtre de contexte pouvant aller jusqu’à 1 million de tokens. Dans la même publication, OpenAI a déclaré que GPT-5.4 a atteint un nouvel état de l’art sur GDPval et a dépassé les performances humaines sur OSWorld-Verified.

Ces benchmarks sont distincts d’un test public d’IQ, mais la direction suivie est alignée. Les capacités progressent dans plusieurs systèmes de mesure distincts, et cette hausse est désormais assez rapide pour influencer la budgétisation, les plans de recrutement, la conception des flux de travail et les dépenses en logiciels.

Un score de 150 sur un benchmark public de type IQ comprime un changement de capacité plus large en un seul signal portable. Le chiffre est facile à comprendre même avant que la méthodologie ne soit discutée.

Le résultat Mensa o3, plus ancien, a établi le benchmark et ses limites. La fenêtre de contexte d’un million de tokens de GPT-4.1 a montré comment OpenAI étendait l’utilité du modèle sur du code et des tâches documentaires sur de longues durées, tandis que notre analyse de la boucle de capital en expansion d’OpenAI a relié les progrès du modèle à l’expansion du matériel, aux boucles de financement et à la demande en infrastructure.

Pris ensemble, ces développements placent le dernier score d’IQ dans un contexte commercial et économique plus large. Un passage de 136 à 150 sur un benchmark public est déjà frappant en soi. Un passage de 136 à 150 pendant qu’OpenAI pousse plus loin l’usage d’outils, l’usage d’ordinateurs, la productivité en entreprise et l’infrastructure à forte intensité de capital entraîne des implications plus larges.

Les benchmarks publics d’IQ sont limités, mais la courbe des capacités continue de monter

Les tests de type IQ restent des instruments imparfaits pour mesurer des modèles de pointe. TrackingAI exécute un benchmark public de type Mensa et conserve aussi un test privé hors-ligne plus strict.

Les tests de type IQ compriment une tranche étroite de performance cognitive en un seul chiffre, masquant la variation entre les types de raisonnement, la gestion du contexte, la créativité et la résolution de problèmes dans le monde réel.

Pour l’IA et les humains, les résultats sont sensibles à la conception du test, à l’exposition à l’entraînement et à la familiarité avec les schémas, ce qui en fait un indicateur bruyant de capacité générale.

Une IQ de 150 se situe à l’extrémité supérieure extrême de la distribution, souvent associée à des individus comme Albert Einstein ou Richard Feynman. Concrètement, cela implique une abstraction très rapide, une forte reconnaissance de motifs, et la capacité de naviguer dans des problèmes complexes en plusieurs étapes avec des indications limitées.

La plateforme présente les scores comme des moyennes mobiles sur les complétions récentes, et la méthodologie soulève des questions familières concernant la structure des prompts, la reproductibilité, la contamination par les ensembles d’entraînement et la familiarité avec le format. Ces préoccupations étaient déjà visibles lorsque o3 a atteint 136, et elles restent actives maintenant que GPT-5.4 Pro se situe à 150.

Lecture connexe

Les scores d’o3 d’OpenAI atteignent 136 sur le test Mensa Norway, dépassant 98 % de la population humaine

Le modèle o3 d’OpenAI atteint un niveau d’IQ Mensa dans des tests indépendants.

Apr 17, 2025 · Liam ‘Akiba’ Wright

Même avec ces limites, le schéma plus large est devenu plus difficile à ignorer. Un seul résultat de benchmark isolé peut s’expliquer par un hasard. Un ensemble de gains observés lors de tests publics de type IQ, de tests de codage, d’usage du navigateur, de navigation sur ordinateur et de performance dans des tâches de knowledge-work porte un poids analytique plus important.

Le dernier classement de TrackingAI place GPT-5.4 Pro en tête de son tableau public d’IQ devant tous les modèles Cluade, Gemini, Qwen et Grok, offrant un benchmark public externe, lisible, qui se traduit rapidement dans le débat plus large sur les capacités.

Peu de personnes ont besoin d’une compréhension détaillée de la conception des benchmarks pour comprendre que 150 se situe dans une plage rare et que les investisseurs n’ont pas besoin d’accepter chaque prémisse derrière un test de type IQ pour reconnaître qu’un saut de cette ampleur suggère une accélération plutôt qu’une dérive.

Graphique intitulé « AI IQ Test Results » montrant les scores moyens d’IQ Mensa Norway pour les principaux modèles d’IA sur une courbe en cloche, avec les variantes GPT-5.4 d’OpenAI tracées près de l’extrémité haute de la plage.

Les acheteurs en entreprise n’ont pas non plus besoin de croire que l’IQ équivaut à l’intelligence générale pour voir que des systèmes avec une meilleure reconnaissance de motifs, un meilleur usage d’outils et une meilleure gestion des tâches sur de longues durées se dirigent vers un territoire économiquement utile, bien au-delà de la résolution d’énigmes.

Cela pointe vers des systèmes capables de rechercher, planifier, vérifier, naviguer et produire du travail réel sur des contextes étendus. Dans ce cadre, le score d’IQ agit moins comme un chiffre de nouveauté et davantage comme un signal de la densité du raisonnement de pointe.

Il existe aussi une valeur concurrentielle dans le classement lui-même. Une position de leader sur un benchmark public renforce la position d’OpenAI dans la course au leadership en capacités visibles, particulièrement à un moment où la différenciation des modèles devient plus difficile à discerner à partir des seules notes d’architecture.

Le leadership en benchmark compresse la complexité en une simple hiérarchie. Il offre aux développeurs un signal, aux acheteurs en entreprise un fil narratif, et aux investisseurs un autre proxy indiquant où se situe actuellement la frontière des capacités.

CryptoSlate Daily Brief

Signaux quotidiens, zéro bruit.

Titres qui font bouger le marché et contexte livrés chaque matin en une lecture concise.

5-minute digest 100k+ lecteurs

Adresse e-mail

Recevoir le brief

Gratuit. Pas de spam. Désinscription à tout moment.

Oups, il semble qu’il y ait eu un problème. Veuillez réessayer.

Vous êtes abonné. Bienvenue à bord.

La montée des benchmarks d’OpenAI commence à chevaucher la semaine économique à venir

La semaine à venir se poursuit encore dans un contexte macro. Le calendrier du Bureau of Labor Statistics présente clairement les prochaines publications clés : les minutes du FOMC de la réunion du 17 au 18 mars, dues le 8 avril ; l’Indice des prix à la consommation de mars, dû le 10 avril ; et l’Indice des prix à la production de mars, dû le 14 avril.

Ce calendrier maintient les inquiétudes sur les taux, l’inflation et la croissance sous les projecteurs, mais sous cette surface, une deuxième dynamique économique se dessine, et OpenAI se situe près de son centre.

La croissance des capacités dans l’IA de pointe recoupe de plus en plus l’allocation de capital. Un modèle qui progresse davantage sur les tests publics de raisonnement tout en s’améliorant aussi en codage, recherche et usage de l’ordinateur change la façon dont les entreprises envisagent la refonte des flux de travail. Cela change ce que les acheteurs de logiciels attendent de copilotes et d’agents. Cela change la vitesse à laquelle les entreprises passent de l’expérimentation au déploiement.

Jack Dorsey a récemment posté que Block passe « de la hiérarchie à l’intelligence », en utilisant l’IA pour prendre en charge le travail de coordination autrefois géré par les niveaux de management, pendant que l’entreprise se réorganise autour de contributeurs individuels, d’individus directement responsables, et de joueurs-entraîneurs

La croissance des capacités modifie aussi les tâches qui peuvent être extraites des structures de coûts liés au travail et réaffectées à des logiciels. Ces effets passent d’abord par des canaux plus étroits, notamment les flux de travail documentaires, les flux de travail de tableurs, le support client, les tâches de recherche, l’automatisation du navigateur, les opérations internes, la génération de code et les boucles de vérification.

La direction commerciale d’OpenAI renforce cette interprétation. Dans ses documents de lancement de GPT-5.4, la société a décrit de meilleures performances dans le travail professionnel, une meilleure recherche via des outils, l’usage natif de l’ordinateur, ainsi que des gains dans le knowledge-work mesuré par benchmark, dans des professions qui correspondent directement à l’économie américaine.

Cela place la croissance des capacités de l’IA dans une question de marché familière : là où l’argent de la dépense se dirige ensuite si ces systèmes continuent de s’améliorer à ce rythme.

La réponse dépasse les revenus d’abonnement au modèle et s’étend à la demande en cloud, aux puces, aux centres de données, aux réseaux, à l’alimentation électrique, aux licences logicielles et aux hypothèses de productivité du travail. La boucle de capital en expansion d’OpenAI reflète déjà une partie de cette structure, et le gain de benchmark ajoute un signal public plus simple par-dessus.

Ce chevauchement est ce qui donne au dernier résultat une pertinence plus large pendant une semaine riche en macro. Les marchés connaissent déjà la configuration liée à l’IPC. Les marchés savent déjà que les prix du pétrole peuvent alimenter les anticipations d’inflation. Les marchés savent déjà que les minutes de la Fed seront analysées pour déterminer le ton en matière de politique.

Mais est-ce que la croissance de l’intelligence elle-même commence à se comporter comme une variable macro ? Des gains de capacités plus rapides peuvent modifier les plans de dépenses des entreprises, renforcer la pression concurrentielle dans les fonctions de cols blancs, soutenir des investissements plus élevés dans l’infrastructure et renforcer l’argument pour des dépenses d’investissement liées à l’IA, même dans un environnement de croissance nominale plus lente.

Quand TrackingAI affiche GPT-5.4 Pro à 150, le chiffre se situe dans un marché qui considère déjà OpenAI comme plus qu’un simple laboratoire. C’est une société de plateforme, une société de déploiement, un client en infrastructure, et un générateur de signaux pour des secteurs adjacents.

Le prochain test se situe à deux endroits à la fois. L’un est méthodologique ; les benchmarks d’IQ de type public continueront de susciter l’examen minutieux, et ils le devraient. L’autre est économique ; les marchés décideront, étape par étape, si des sauts de capacité de cette ampleur doivent être intégrés aux prix aux côtés des données sur l’emploi, des attentes de taux et des tendances en matière de dépenses en capital.

La montée du benchmark la plus récente d’OpenAI rapproche cette décision. Le score est compact, lisible et facile à diffuser. Sa pertinence plus profonde vient du même endroit que la poussée produit plus large de la société ; la frontière continue de progresser, et l’empreinte économique de cette progression devient plus difficile à maintenir dans une catégorie séparée.

Mentionné dans cet article

OpenAI Anthropic Google X Sam Altman

Publié dans

En vedette États-Unis Technologie Culture IA Communauté

Contexte

Couverture connexe

Changez de catégories pour aller plus loin ou obtenir un contexte plus large.

Actualités locales US      IA Top Category      Communiqués de presse Newswire  

Analyse

Les emplois US dépassent les prévisions, mais une faiblesse cachée sur le travail pourrait maintenir Bitcoin sous pression

Un fort chiffre sur l’emploi a repoussé davantage les baisses de taux, mais des signaux de travail plus faibles laissent Bitcoin exposé au prochain test de données.

Il y a 4 heures

Les « acheteurs permanents » de Bitcoin commencent à vendre alors que la pression sur la dette et la trésorerie s’intensifie

Alors que les détenteurs de trésorerie vendent pour couvrir des besoins de dette et de liquidité, l’un des récits institutionnels les plus solides de Bitcoin commence à se fissurer.

Il y a 1 jour

Les dérivés Bitcoin affichent un avertissement alors que le marché de 46B se retire du rallye de trêve en Iran

Analyse · 1 jour

Les États-Unis libèrent des milliards pour les banques tout en admettant discrètement que l’échec central de la SVB n’a jamais disparu

Banque · 1 jour

L’histoire de valeur refuge de Bitcoin se fissure alors que le choc lié à la guerre relance un risque de 10 000 $ si le pétrole atteint 150 $ le baril

Analyse · 2 jours

La CFTC poursuit 3 États pour redéfinir les marchés de prédiction crypto comme des produits fédéraux

Régulation · 2 jours

Technologie

Ripple pousse une blockchain plus privée vers les banques et ajoute des contrôles de code IA alors que les craintes grandissent qu’elle laisse le prix de XRP derrière

Ripple vise à révolutionner la blockchain institutionnelle avec des fonctionnalités améliorées de confidentialité et de sécurité IA sur l’XRPL.

Il y a 6 jours

Analyse

Les gagnants de la crypto liés à l’IA ne sont pas des pièces d’IA lorsque les agents commencent à dépenser de manière autonome

L’essor des agents IA pose une question simple avec de grandes implications pour la crypto : comment les logiciels paient-ils ?

Il y a 1 semaine

Le reset de l’IA est désormais en cours alors que les licenciements s’accélèrent et qu’un groupe est touché le plus durement

IA · 3 semaines ago

La crypto peut-elle nous protéger contre l’enchevêtrement grandissant d’agents économiques d’IA ?

IA · 4 semaines ago

L’IA embauche davantage de développeurs seniors tout en effaçant discrètement les emplois qui les créent

IA · 4 semaines ago

L’un des plus grands mineurs de Bitcoin US envisage de vendre la totalité de son stock de 53 000 BTC

Extraction · 1 mois

ADI Chain annonce ADI Predictstreet comme partenaire du marché de prédiction pour la Coupe du monde FIFA 2026

Soutenu par ADI Chain, ADI Predictstreet fera ses débuts sur la plus grande scène du football en tant que partenaire officiel du marché de prédiction de la Coupe du monde FIFA 2026.

Il y a 2 jours

La bourse BTCC nommée partenaire régional officiel de l’équipe nationale argentine

BTCC s’est associée à l’Association de football argentine via la Coupe du monde FIFA 2026, reliant la présence crypto de longue date de l’échange à l’une des équipes nationales les plus titrées du football.

Il y a 3 jours

Encrypt arrive sur Solana pour alimenter des marchés de capitaux chiffrés

PR · 5 jours

Ika arrive sur Solana pour alimenter des marchés de capitaux sans pont

PR · 5 jours

Le lancement du réseau principal TxFlow L1 marque une nouvelle phase pour la finance on-chain multi-applications

PR · 5 jours

BYDFi marque son 6e anniversaire avec une célébration d’un mois, conçue pour la fiabilité

PR · 5 jours

Déclaration

Les opinions de nos auteurs sont uniquement les leurs et ne reflètent pas l’opinion de CryptoSlate. Aucune des informations que vous lisez sur CryptoSlate ne doit être considérée comme un conseil en investissement, et CryptoSlate n’approuve aucun projet qui pourrait être mentionné ou lié dans cet article. L’achat et la négociation de cryptomonnaies doivent être considérés comme une activité à haut risque. Veuillez effectuer vos propres vérifications diligentes avant toute action liée au contenu de cet article. Enfin, CryptoSlate n’assume aucune responsabilité si vous perdez de l’argent en négociant des cryptomonnaies. Pour plus d’informations, consultez nos déclarations légales d’entreprise.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler