Können KI-Agenten die Sicherheit von Ethereum verbessern? OpenAI und Paradigm haben eine Testumgebung geschaffen

ETH2,35%

Kurzfassung

  • EVMbench testet KI-Agenten auf 120 reale Ethereum-Smart-Contract-Schwachstellen.
  • Das Tool bewertet Erkennung, Behebung und Ausnutzung in drei unterschiedlichen Modi.
  • GPT-5.3-Codex erreichte eine Erfolgsquote von 72,2 % im Exploit-Modus.

Der ChatGPT-Hersteller OpenAI und die auf Kryptowährungen fokussierte Investmentfirma Paradigm haben EVMbench vorgestellt, ein Tool zur Verbesserung der Sicherheit von Ethereum Virtual Machine (EVM)-Smart-Contracts.
EVMbench ist entwickelt worden, um die Fähigkeit von KI-Agenten zu bewerten, hochgradige Schwachstellen in EVM-Smart-Contracts zu erkennen, zu beheben und auszunutzen.
Smart Contracts sind das Herzstück des Ethereum-Netzwerks und enthalten den Code, der alles von dezentralen Finanzprotokollen bis hin zu Token-Starts antreibt. Laut Token Terminal erreichte die wöchentliche Anzahl der auf Ethereum bereitgestellten Smart Contracts im November 2025 einen Rekordwert von 1,7 Millionen, wobei allein in der letzten Woche 669.500 Deployments stattfanden.

EVMbench basiert auf 120 ausgewählten Schwachstellen aus 40 Audits, die größtenteils aus offenen Audit-Wettbewerben wie Code4rena stammen, so ein Blogbeitrag von OpenAI. Es umfasst auch Szenarien aus dem Sicherheits-Audit-Prozess für Tempo, eine speziell für hohe Durchsatzraten und kostengünstige Stablecoin-Zahlungen entwickelte Layer-1-Blockchain von Stripe.
Stripe startete im Dezember das öffentliche Testnetz für Tempo und erklärte damals, dass es mit Input von Visa, Shopify und OpenAI entwickelt werde. Ziel sei es, Tests auf wirtschaftlich relevanten, realen Codebasis durchzuführen, insbesondere im Zuge der Expansion KI-gesteuerter Stablecoin-Zahlungen, so das Unternehmen.

Einführung von EVMbench – einem neuen Benchmark, der misst, wie gut KI-Agenten hochgradige Schwachstellen in Smart Contracts erkennen, ausnutzen und beheben können. https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 18. Februar 2026

EVMbench soll KI-Modelle in drei Modi bewerten: Erkennen, Beheben und Ausnutzen. Im „Erkennen“-Modus prüfen Agenten Repositories auf bekannte Schwachstellen und werden anhand ihrer Trefferquote bewertet. Im „Beheben“-Modus müssen Agenten Schwachstellen eliminieren, ohne die beabsichtigte Funktionalität zu zerstören. Im letzten Schritt, dem „Ausnutzen“-Modus, versuchen die Agenten, End-to-End-Angriffe zum Abziehen von Geldern in einer sandboxed Blockchain-Umgebung durchzuführen, wobei die Bewertung durch deterministische Transaktionswiedergabe erfolgt.

Im Exploit-Modus erreichte GPT-5.3-Codex, das über OpenAI’s Codex CLI läuft, eine Punktzahl von 72,2 %, verglichen mit 31,9 % für GPT-5, das vor sechs Monaten veröffentlicht wurde. Die Leistung bei den Erkennungs- und Behebungsaufgaben war schwächer, da die Agenten manchmal nicht gründlich genug auditierten oder Schwierigkeiten hatten, die vollständige Funktionalität des Vertrags zu bewahren.

Die Forscher von OpenAI warnten, dass EVMbench die reale Sicherheitskomplexität nicht vollständig abbildet. Dennoch betonten sie, dass die Messung der KI-Leistung in wirtschaftlich relevanten Umgebungen entscheidend sei, da Modelle immer mächtigere Werkzeuge für Angreifer und Verteidiger werden.

Sam Altman von OpenAI und Ethereum-Mitbegründer Vitalik Buterin standen zuvor wegen des Tempos der KI-Entwicklung im Konflikt.
Im Januar 2025 sagte Altman, sein Unternehmen sei „zuversichtlich, dass wir wissen, wie man eine AGI baut, wie wir sie traditionell verstanden haben.“ Buterin plädierte hingegen dafür, dass KI-Systeme eine „weiche Pause“-Funktion enthalten sollten, die vorübergehend industrielle KI-Operationen einschränken kann, falls Warnzeichen auftreten.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

BlackRock „Ether-Staking-ETF" macht großen Auftritt! Das Handelsvolumen am ersten Handelstag übersteigt 15,5 Millionen US-Dollar

BlackRock hat den „iShares Ethereum Staking Trust ETF (ETHB)" eingeführt, dessen Handelsvolumen am ersten Handelstag 15,5 Millionen US-Dollar überstieg und einen Meilenstein für institutionelle Kapitalzuflüsse in Ethereum darstellte. Dieser ETF hält Ethereum und führt Staking durch, wobei Anleger von Preisschwankungen und Staking-Belohnungen profitieren. ETHB plant, 70 % bis 95 % des Ethereum zum Staking einzusetzen, wobei 82 % der Erträge monatlich an die Inhaber ausgeschüttet werden.

区块客37M her

BlackRock überwies 567 BTC und 22.657 ETH an eine bestimmte CEX, mit einem Gesamtwert von über 94 Millionen US-Dollar

Gate News Nachricht: Am 17. März haben die Überwachungsdaten von Onchain Lens gezeigt, dass das Vermögensmanagementunternehmen BlackRock 567 BTC im Wert von etwa 41,78 Millionen US-Dollar an eine bestimmte CEX eingezahlt hat. Gleichzeitig wurden 22.657 ETH im Wert von etwa 52,40 Millionen US-Dollar überwiesen. Der Gesamtwert der beiden Transaktionen überstieg 94 Millionen US-Dollar.

GateNews1Std her

Bitmine kauft 60.999 ETH, erhöht Treasury auf $11,5B

Bitmine erwarb diese Woche 60.999 ETH und erhöhte die Gesamtbestände auf 4,59M ETH im Wert von etwa 11,5 Mrd. Dollar. Etwa 3,04M ETH werden über seine Validatoren gestakt und generieren etwa $180M an annualisierten Belohnungen. Das Unternehmen nähert sich seinem 5%-ETH-Versorgungsziel und erweitert gleichzeitig Validator- und Eigenkapitalinvestitionen. Bit

CryptoFrontNews1Std her

Südkoreanische Polizei plant Richtlinien zur Beschlagnahme von Privacy Coins, in den letzten fünf Jahren beschlagnahmte virtuelle Vermögenswerte im Wert von etwa 54,5 Milliarden Won

Die südkoreanische Polizeibehörde arbeitet an neuen Richtlinien zur Verwaltung der Beschlagnahme von virtuellen Vermögenswerten und bezieht erstmals die Handhabung von Privacy Coins ein. Die neuen Vorschriften werden die Verwaltung von Software-Wallets klären, Lücken bei der Verwahrung von virtuellen Vermögenswerten beheben und die Durchsetzungseffizienz verbessern. Die Polizei plant, private Verwahrstellen auszuwählen, während Experten empfehlen, einen zentralisierten öffentlichen Verwahrmechanismus zu etablieren, um Risiken zu verringern. Diese Reform wurde auch durch kürzliche Bitcoin-Diebstähle vorangetrieben und führt das Verwaltungssystem in das digitale Vermögenszeitalter über.

区块客1Std her
Kommentieren
0/400
Keine Kommentare