OpenAI et Paradigm lancent EVMbench pour la sécurité d'Ethereum

ETH-3,03%
  • OpenAI et Paradigm ont créé EVMbench à partir de 120 vulnérabilités réelles d’audit.

  • Les tests de référence évaluent l’IA en modes détection, correction et exploitation en utilisant des environnements EVM isolés.

  • GPT-5.3-Codex a obtenu un score de 72,2 % en mode exploitation, surpassant les résultats antérieurs de GPT-5.

OpenAI, en collaboration avec Paradigm, a dévoilé une nouvelle référence pour tester la performance de l’IA sur la sécurité des contrats intelligents Ethereum. La sortie, annoncée cette semaine, a introduit EVMbench comme un moyen de mesurer comment les agents IA détectent, corrigent et exploitent les failles des contrats. L’initiative vise à répondre à la montée des risques, alors que les contrats intelligents sécurisent plus de 100 milliards de dollars d’actifs cryptographiques sur les réseaux EVM.

Une référence construite à partir d’échecs d’audit réels

Selon OpenAI, EVMbench s’appuie sur 120 vulnérabilités de haute gravité identifiées lors de 40 audits professionnels de contrats intelligents. Notamment, bon nombre de ces problèmes proviennent de concours d’audit ouverts, notamment Code4rena. La référence se concentre sur de véritables bugs plutôt que sur des exemples synthétiques.

De plus, OpenAI indique que l’ensemble de données inclut des scénarios liés à des travaux de sécurité sur la chaîne Tempo. Tempo fonctionne comme un réseau Layer-1 axé sur les paiements, conçu pour les transferts de stablecoins. En conséquence, ces cas introduisent des risques liés à la logique de paiement dans l’environnement de référence.

Pour soutenir des tests réalistes, les ingénieurs ont réutilisé des scripts de preuve de concept d’exploitation lorsque disponibles. Cependant, ils ont construit manuellement les composants manquants lorsque la documentation était incomplète. OpenAI affirme avoir préservé la possibilité d’exploitation tout en assurant que les correctifs pouvaient se compiler correctement.

Trois modes de test pour mettre à l’épreuve les agents IA

EVMbench évalue les agents en modes détection, correction et exploitation. En mode détection, les agents analysent des dépôts et reçoivent des scores basés sur la recall des vulnérabilités confirmées. En mode correction, ils doivent réparer les failles tout en conservant le comportement original du contrat.

Le mode exploitation, quant à lui, simule des attaques complètes de drain de fonds dans une blockchain sandbox. OpenAI indique que les évaluateurs confirment les résultats par la relecture des transactions et des vérifications de l’état sur la chaîne. Pour garantir la cohérence, la société a développé un environnement de déploiement déterministe basé sur Rust.

Les tests d’exploitation s’effectuent dans un environnement Anvil local, et non sur des réseaux en direct. OpenAI précise que toutes les vulnérabilités sont historiques et publiquement divulguées. De plus, l’environnement limite les appels RPC non sécurisés pour réduire les abus.

Résultats et expansion de l’équipe

Dans les résultats rapportés, GPT-5.3-Codex a obtenu un score de 72,2 % en mode exploitation. En comparaison, GPT-5 a atteint 31,9 %, malgré son lancement plusieurs mois plus tôt. Cependant, OpenAI indique que la couverture en détection et correction reste incomplète.

Par ailleurs, en plus d’EVMbench, OpenAI a confirmé une embauche clé. Peter Steinberger, fondateur d’OpenClaw, a rejoint l’entreprise pour travailler sur le développement d’agents. Sam Altman a confirmé ce mouvement sur X, précisant que Steinberger dirigera les projets d’agents personnels de nouvelle génération.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

# Flux de Trésorerie des ETF Crypto Semaine 16-20/3 : Bitcoin Poursuit sa Tendance de Croissance, Ethereum Enregistre des Sorties Nettes de Capitaux

Le marché des cryptomonnaies a connu des tendances mitigées la semaine dernière, les Bitcoin Spot ETFs attirant 95,18 millions de dollars d'entrées, tandis que les Ethereum Spot ETFs ont enregistré 59,94 millions de dollars de sorties. Les Altcoin ETFs ont montré des signes positifs, SOL et XRP enregistrant également des entrées nettes.

TapChiBitcoinIl y a 12m

NYSE lève complètement les restrictions sur les options des ETF Bitcoin et Ethereum! La limite de 25 000 contrats est annulée, et l'espace de manœuvre pour les fonds institutionnels s'élargit considérablement

Le marché américain des ETF cryptographiques connaît un désengagement institutionnel majeur. NYSE Arca et NYSE American ont levé les limites de position et d'exercice pour les options d'ETF au comptant Bitcoin et Ethereum, avec l'approbation immédiate de la SEC. Cet ajustement améliore la liquidité du marché, permettant aux investisseurs institutionnels d'employer des stratégies plus flexibles et favorisant davantage la maturation du marché des ETF cryptographiques.

ChainNewsAbmediaIl y a 50m

Le Trésor USDC a brûlé 50 millions d'USDC sur la chaîne Ethereum

Selon Gate News, le 23 mars, d'après Whale Alert, le USDC Treasury a effectué une opération de destruction sur la blockchain Ethereum, détruisant au total 50 000 000 USDC.

GateNewsIl y a 52m

La semaine dernière, l'ETF au comptant Ethereum a enregistré des sorties nettes de 59,94 millions de dollars, tandis que l'ETHA de BlackRock a enregistré des sorties nettes de 69,58,65 millions de dollars.

La semaine dernière, les ETF au comptant Ethereum ont enregistré des sorties nettes de 59,94 millions de dollars, l'ETF BlackRock ETHA ayant connu les plus importantes sorties avec 69,5865 millions de dollars, tandis que l'ETF Fidelity FETH a également enregistré des sorties de 61,6216 millions de dollars. Le Grayscale Ethereum Mini Trust ETH a enregistré des entrées nettes de 6,8702 millions de dollars. L'actif net total des ETF au comptant Ethereum s'élève actuellement à 1,2330 milliards de dollars.

GateNewsIl y a 52m

Comment les petits investisseurs peuvent-ils investir dans OpenAI ? Analyse des positions indirectes avant l'IPO

OpenAI devrait lancer son introduction en bourse (IPO) en 2026, avec une valorisation potentielle de 8 500 millions de dollars. Les investisseurs ordinaires peuvent investir indirectement par le biais de ses principaux actionnaires (tels que Microsoft et SoftBank) ou d'Eightco Holdings. Eightco détient 9 000 millions de dollars de capitaux propres d'OpenAI et est également un détenteur majeur de cryptomonnaies, offrant une alternative aux investisseurs.

ChainNewsAbmediaIl y a 59m

Un détenteur précoce d'ETH de 2016 qui a été inactif pendant un an a déposé 15 000 ETH vers un certain CEX, avec un coût de détention d'environ 11,61 dollars.

Gate News Alert: On March 23rd, according to on-chain analyst Ai Yi's monitoring, an early ETH holder from 2016 (address 0xa2F...F85A) who has been dormant for a year deposited 15,000 ETH to a certain CEX, valued at $30.97 million. This address has been accumulating ETH since 2016 with a cost price of $11.61. If sold this time, it would realize a profit of $30.79 million, with a return rate of 17,680%.

GateNewsIl y a 1h
Commentaire
0/400
Aucun commentaire