OpenAI setzt KI-Agenten gegeneinander ein, um Smart Contracts zu red-teamen

CryptoBreaking

OpenAI hat ein Benchmarking-Framework vorgestellt, das darauf abzielt, zu messen, wie effektiv KI-Agenten Sicherheitslücken in Krypto-Smart-Contracts erkennen, mindern und sogar ausnutzen können. Das Projekt mit dem Titel „EVMbench: Evaluierung von KI-Agenten im Bereich Smart Contract Security“ wurde in Zusammenarbeit mit Paradigm und OtterSec veröffentlicht, zwei Organisationen mit tiefgreifender Erfahrung in Blockchain-Sicherheit und Investitionen. Die Studie bewertet KI-Agenten anhand eines kuratierten Satzes von 120 potenziellen Schwachstellen, die aus 40 Smart-Contract-Audits stammen, mit dem Ziel, nicht nur die Erkennungs- und Patch-Fähigkeiten, sondern auch das theoretische Exploit-Potenzial dieser Agenten in einer kontrollierten Umgebung zu quantifizieren.

Wichtigste Erkenntnisse

EVMbench testet KI-Agenten anhand von 120 Schwachstellen, die aus 40 Smart-Contract-Audits stammen, wobei der Schwerpunkt auf Schwachstellen aus Open-Source-Audit-Wettbewerben liegt.

Unter den getesteten Modellen führte Anthropic’s Claude Opus 4.6 mit einem durchschnittlichen Erkennungswert von 37.824 $, gefolgt von OpenAI’s OC-GPT-5.2 mit 31.623 $ und Google’s Gemini 3 Pro mit 25.112 $.

OpenAI beschreibt das Benchmark als einen Schritt zur Messung der KI-Leistung in „wirtschaftlich bedeutungsvollen Umgebungen“ und nicht nur bei Spielzeugaufgaben, wobei die realen Auswirkungen für Angreifer und Verteidiger im Krypto-Sicherheitsbereich hervorgehoben werden.

Die Forscher weisen darauf hin, dass Smart Contracts Vermögenswerte im Wert von Milliarden von Dollar sichern, was den strategischen Wert KI-gestützter Werkzeuge für offensive und defensive Aktivitäten unterstreicht.

Branchenbeobachter verbinden diese Entwicklungen mit breiteren Diskussionen über KI-gesteuerte Zahlungen und die Rolle von Stablecoins im Alltag, wobei führende Manager eine zunehmende Nutzung durch Agenten in den kommenden Jahren vorhersagen.

Der Kontext für diese Arbeit wird durch die Krypto-Sicherheitsvorfälle im Jahr 2025 unterstrichen, bei denen weiterhin Gelder durch Schwachstellen und Angriffe fließen, was die Nachfrage nach robusten, KI-gestützten Prüf- und Verteidigungsmechanismen verstärkt.

Die Erkennungsprämien für KI-Agenten sind im OpenAI-PDF, das die Studie begleitet, detailliert beschrieben. Dieses beschreibt auch die Bewertungsmethodik und die Szenarien, die zur Simulation realer Smart-Contract-Risiken verwendet wurden. Die Autoren betonen, dass, obwohl sich KI-Agenten weiterentwickelt haben, um eine Vielzahl routinemäßiger Aufgaben zu automatisieren, die Bewertung ihrer Leistung in „wirtschaftlich bedeutungsvollen Umgebungen“ entscheidend ist, um zu verstehen, wie sie unter Druck in Produktionssystemen abschneiden.

„Smart Contracts sichern Milliarden von Dollar an Vermögenswerten, und KI-Agenten werden wahrscheinlich sowohl für Angreifer als auch für Verteidiger transformativ sein.“

OpenAI erwartet, dass agentenbasierte Technologien den Umfang von Zahlungen und Abwicklungen erweitern, einschließlich in automatisierten Workflows verwendeter Stablecoins. Die Diskussion um KI-gestützte Zahlungen geht über Sicherheitstests hinaus und befasst sich mit der breiteren Frage, wie autonome Systeme am täglichen Finanzverkehr teilnehmen werden. Die eigenen Prognosen des Unternehmens deuten darauf hin, dass agentenbasierte Zahlungen in der Praxis häufiger werden könnten, wobei KI-Fähigkeiten in praktische Anwendungsfälle eingebunden werden, die alltägliche Verbrauchertransaktionen berühren.

In Verbindung mit den Benchmark-Ergebnissen hat Circle-CEO Jeremy Allaire öffentlich prognostiziert, dass innerhalb der nächsten fünf Jahre Milliarden von KI-Agenten mit Stablecoins für alltägliche Zahlungen transagieren könnten. Dieser Blickwinkel überschneidet sich mit einem wiederkehrenden Thema in Krypto-Kreisen: Das Potenzial, dass Krypto zur nativen Währung für KI-Agenten wird – eine Erzählung, die sowohl von Branchenführern als auch Investoren zunehmend Aufmerksamkeit erhält. Obwohl solche Vorhersagen spekulativ bleiben, ist der zugrunde liegende Trend klar: KI-Automatisierung bewegt sich vom Labor in die Transaktionsschicht, wo sie die Bewegung von Werten über Netzwerke hinweg neu gestalten könnte.

Die Studie erscheint zu einem Zeitpunkt, an dem die Krypto-Sicherheit weiterhin ein bedeutendes Risiko für Investoren darstellt. Der Datenpunkt zu den Angriffen auf Krypto-Fonds im Jahr 2025, bei denen Angreifer rund 3,4 Milliarden Dollar erbeuteten, unterstreicht die Dringlichkeit verbesserter Werkzeuge und schnelleren, zuverlässigeren Patch-Mechanismen. Das EVMbench-Framework wird teilweise als Mittel positioniert, um zu messen, ob KI-Agenten in großem Maßstab sinnvoll zur Verteidigung beitragen können, indem sie Exploit-Möglichkeiten reduzieren und die Bedrohungsabwehr beschleunigen.

Für den Aufbau des Benchmarks griffen die Forscher auf 120 kuratierte Schwachstellen aus 40 Smart-Contract-Audits zurück, wobei viele Schwachstellen auf Open-Source-Audit-Herausforderungen zurückzuführen sind. OpenAI argumentiert, dass das Benchmark dabei helfen wird, den Fortschritt der KI bei der Erkennung und Minderung von Schwachstellen auf Contract-Ebene im großen Maßstab zu verfolgen und eine standardisierte Vergleichsbasis für zukünftige KI-Modelle zu bieten. Die Studie bietet zudem einen Einblick, wie KI angewendet werden könnte, um Risikobewertungen über eine Vielzahl von Smart-Contract-Architekturen zu normalisieren, anstatt sich nur auf einzelne Fälle zu konzentrieren.

Smart Contracts wurden nicht für Menschen entwickelt: Dragonfly

In einem gleichzeitigen Thread auf X argumentierte Haseeb Qureshi, Partner bei Dragonfly, dass das Versprechen der Krypto-Technologie, Eigentumsrechte und traditionelle Verträge zu ersetzen, nie realisiert wurde – nicht weil die Technologie versagte, sondern weil sie nie mit menschlicher Intuition konzipiert wurde. Er hebt die anhaltende Angst hervor, große Transaktionen zu signieren, in einer Umgebung, in der Drainer-Wallets und andere Angriffsvektoren eine ständige Bedrohung darstellen, im krassen Gegensatz zu den vergleichsweise reibungslosen Erfahrungen bei traditionellen Banküberweisungen.

Qureshi ist der Ansicht, dass die nächste Phase der Krypto-Transaktionen durch KI-gestützte, selbstfahrende Wallets ermöglicht werden könnte. Solche Wallets würden Risiken überwachen, komplexe Operationen verwalten und autonom auf Bedrohungen im Auftrag der Nutzer reagieren, wodurch die Friktionen und Ängste, die große Transfers heute begleiten, reduziert werden könnten.

„Eine Technologie fügt sich oft erst dann nahtlos ein, wenn ihr Gegenstück endlich vorhanden ist. GPS musste auf das Smartphone warten, TCP/IP auf den Browser. Für Krypto könnten wir es jetzt in KI-Agenten gefunden haben.“

Der übergeordnete Eindruck dieses Threads ist, dass KI-Agenten eine entscheidende Rolle bei der Transformation der Interaktion mit Krypto spielen könnten – weg von manuellen, fehleranfälligen Transaktionen hin zu automatisierten, risikobewussten Prozessen, die mit der Akzeptanz wachsen. Während KI-Agenten zunehmend Kompetenz im Umgang mit Sicherheitsfragen zeigen, könnten Nutzer eine verbesserte Zuverlässigkeit und Widerstandsfähigkeit in dezentralen Finanz-Workflows erleben, auch wenn die zugrunde liegenden Technologien weiter reifen.

Was als Nächstes zu beobachten ist

Veröffentlichung und unabhängige Replikation des vollständigen EVMbench-Datensatzes mit weiteren KI-Modellen und Architekturen.

Breitere Akzeptanz von KI-gestützten Prüfungs-Workflows durch Prüfer, Börsen und DeFi-Projekte, die ihre Sicherheitslage stärken wollen.

Erforschung agentenbasierter Wallets und autonomer Zahlungsflüsse, einschließlich regulatorischer und Compliance-Aspekte für KI-verwaltete Vermögenswerte.

Folge-Benchmarks, die weitere KI-Systeme vergleichen, sobald neue Versionen veröffentlicht werden, um Verbesserungen bei Erkennungsgenauigkeit und Patch-Geschwindigkeit zu verfolgen.

Quellen & Verifikation

OpenAI: EVMbench: Evaluierung von KI-Agenten im Bereich Smart Contract Security — PDF: https://cdn.openai.com/evmbench/evmbench.pdf

OpenAI: Einführung von EVMbench — https://openai.com/index/introducing-evmbench/

Krypto-Sicherheitsverluste 2025 (Berichtsdaten): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks

Dragonfly: Haseeb Qureshi zu KI und Krypto-UX (X-Post): https://x.com/hosseeb/status/2024136762424185208

Chinas KI-Fortschritt und Krypto-Auswirkungen (Analyse): https://cointelegraph.com/news/china-ai-lead-future

AI Eye — Entwicklungen bei IronClaw und KI-Bots in Polymarket-Berichterstattung: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Schlüsselzahlen und nächste Schritte

Die EVMbench-Studie zeigt, dass große Sprachmodelle und verwandte KI-Agenten zunehmend bedeutende Sicherheitsarbeit im Bereich Smart Contracts leisten, mit klar messbaren Unterschieden zwischen den Modellen. Claude Opus 4.6 führt bei den durchschnittlichen Erkennungsprämien an, was darauf hindeutet, dass bestimmte Architekturen besser darin sind, Schwachstellen in komplexen Vertragslogiken zu erkennen und zu mindern, während andere noch Nachholbedarf haben. Die Einbindung mehrerer Branchenpartner unterstreicht den wachsenden Konsens, dass KI-gestützte Sicherheit und automatisiertes Risikomanagement essenziell für die Skalierung in dezentralen Umgebungen werden könnten.

Mit fortschreitender Entwicklung wird es für Beobachter interessant sein, wie schnell KI-Agenten von der Erkennung zur Behebung übergehen und ob diese zuverlässig in Live-Systemen arbeiten können, ohne neue Risiken zu schaffen. Die Diskussion um KI-gesteuerte Wallets und autonome Zahlungen berührt auch breitere Fragen zu Sicherheitsgovernance, Nutzerzustimmung und regulatorischer Abstimmung. Wenn der von OpenAI und seinen Partnern eingeschlagene Kurs anhält, könnten KI-gestützte Werkzeuge zu einem Kernbestandteil zukünftiger Krypto-Infrastruktur werden, was sowohl das Risikoverständnis als auch die Nutzererfahrung maßgeblich verändern dürfte. Die nächsten Benchmarks und reale Einsätze werden zeigen, wie schnell sich diese Vision verwirklicht und welche Sicherheitsvorkehrungen notwendig sind.

Dieser Artikel wurde ursprünglich veröffentlicht unter dem Titel „OpenAI setzt KI-Agenten gegeneinander ein, um Smart Contracts im Crypto Breaking News zu testen – Ihre vertrauenswürdige Quelle für Krypto-News, Bitcoin-News und Blockchain-Updates.“

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare