OpenAI dan Paradigm Meluncurkan EVMbench untuk Keamanan Ethereum

ETH1,02%
  • OpenAI dan Paradigm membangun EVMbench dari 120 kerentanan audit nyata.

  • Pengujian benchmark menguji AI dalam mode deteksi, perbaikan, dan eksploitasi menggunakan lingkungan sandbox EVM.

  • GPT-5.3-Codex mendapatkan skor 72,2% dalam mode eksploitasi, mengungguli hasil GPT-5 sebelumnya.

OpenAI, bekerja sama dengan Paradigm, mengungkapkan sebuah tolok ukur baru untuk menguji kinerja AI dalam keamanan kontrak pintar Ethereum. Rilis ini, yang diumumkan minggu ini, memperkenalkan EVMbench sebagai cara untuk mengukur bagaimana agen AI mendeteksi, memperbaiki, dan mengeksploitasi kelemahan kontrak. Upaya ini menargetkan risiko yang meningkat, karena kontrak pintar mengamankan lebih dari $100 miliar aset kripto di jaringan EVM.

Tolok ukur Dibangun dari Kegagalan Audit Dunia Nyata

Menurut OpenAI, EVMbench diambil dari 120 kerentanan tingkat tinggi yang diidentifikasi dari 40 audit kontrak pintar profesional. Terutama, banyak dari masalah ini berasal dari kompetisi audit terbuka, termasuk Code4rena. Tolok ukur ini fokus pada bug nyata daripada contoh sintetis.

Selain itu, OpenAI mengatakan dataset ini mencakup skenario terkait pekerjaan keamanan di rantai Tempo. Tempo beroperasi sebagai jaringan Layer-1 yang berfokus pada pembayaran yang dibangun untuk transfer stablecoin. Karena itu, kasus-kasus ini memperkenalkan risiko logika pembayaran ke dalam lingkungan tolok ukur.

Untuk mendukung pengujian yang realistis, insinyur menggunakan kembali skrip bukti konsep eksploitasi yang tersedia. Namun, mereka secara manual membangun komponen yang hilang ketika dokumentasi terbukti tidak lengkap. OpenAI mengatakan mereka mempertahankan kemampuan eksploitasi sambil memastikan perbaikan dapat dikompilasi dengan benar.

Tiga Mode Pengujian Menguji Agen AI

EVMbench mengevaluasi agen dalam mode deteksi, perbaikan, dan eksploitasi. Dalam mode deteksi, agen memindai repositori dan menerima skor berdasarkan tingkat keberhasilan deteksi kerentanan. Dalam mode perbaikan, agen harus memperbaiki kelemahan sambil mempertahankan perilaku kontrak asli.

Mode eksploitasi, bagaimanapun, mensimulasikan serangan penuh yang menguras dana dalam blockchain sandbox. OpenAI mengatakan penilai mengonfirmasi hasil melalui pemutaran ulang transaksi dan pemeriksaan status di blockchain. Untuk memastikan konsistensi, perusahaan membangun alat pengujian berbasis Rust untuk penyebaran deterministik.

Pengujian eksploitasi dijalankan di lingkungan Anvil lokal, bukan jaringan langsung. OpenAI mencatat bahwa semua kerentanan bersifat historis dan telah dipublikasikan. Selain itu, alat pengujian membatasi panggilan RPC yang tidak aman untuk mengurangi penyalahgunaan.

Hasil dan Perluasan Tim

Dalam hasil yang dilaporkan, GPT-5.3-Codex mencapai skor 72,2% dalam mode eksploitasi. Sebagai perbandingan, GPT-5 mencapai 31,9%, meskipun diluncurkan beberapa bulan sebelumnya. Namun, OpenAI mengatakan bahwa cakupan deteksi dan perbaikan masih belum lengkap.

Selain EVMbench, OpenAI mengonfirmasi perekrutan kunci. Peter Steinberger, pendiri OpenClaw, bergabung dengan perusahaan untuk bekerja pada pengembangan agen. Sam Altman mengonfirmasi langkah ini di X, menyebutkan bahwa Steinberger akan memimpin proyek agen pribadi generasi berikutnya.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Coin Center Mendesak SEC Menetapkan Aturan Kripto Terpadu, Menentang Mekanisme Pengecualian Kasus per Kasus

18 Maret, Coin Center mengirimkan surat kepada SEC Amerika Serikat, mendesak penetapan prioritas aturan regulasi aset kripto yang sistematis untuk menghindari fragmentasi pasar dan ketidakadilan. Surat ini menunjukkan bahwa jaringan kripto harus dipandang sebagai infrastruktur publik. SEC baru-baru ini menerbitkan klasifikasi aset kripto non-keamanan dan menandatangani memorandum pemahaman dengan CFTC, bertujuan untuk memperkuat koordinasi regulasi. Coin Center memperingatkan bahwa regulasi selektif dapat mempengaruhi keadilan pasar. Kongres Amerika Serikat sedang mendorong CLARITY Act, dengan harapan memberikan jalur kepatuhan yang jelas untuk aset digital.

GateNews36menit yang lalu

Bitwise membeli 142 juta dolar ETH minggu lalu, total kepemilikan melampaui 10,7 miliar USD

Bitmine, yang terkait dengan analis kripto Tom Lee, baru-baru ini membeli Ethereum senilai $142 juta, meningkatkan total kepemilikannya menjadi lebih dari $10,7 miliar. Perusahaan ini sekarang memiliki 3,8% dari total pasokan ETH dan terus membeli secara agresif, memicu spekulasi tentang kapan "paus" ini akan berhenti.

TapChiBitcoin1jam yang lalu

Ketua SEC Paul Atkins Mengusulkan Kerangka Kerja Safe Harbor Kriptografi, Bertujuan Memberikan Pengecualian Regulasi untuk Penerbitan Token

Ketua SEC Amerika Paul Atkins mengusulkan peluncuran skema pengecualian "safe harbor" untuk memberikan jalur kepatuhan yang fleksibel bagi perusahaan kripto, termasuk "pengecualian startup" dan "pengecualian pendanaan". SEC merencanakan untuk menerbitkan draf peraturan terkait dalam beberapa minggu mendatang untuk memperjelas cakupan pengawasan aset kripto, yang berpotensi menarik lebih banyak dana institusional ke pasar.

GateNews1jam yang lalu

Arus masuk bersih total ETF spot Ethereum kemarin adalah @1.3828@ juta dolar, dengan BlackRock ETHA di posisi teratas

17 Maret, total net inflow ETF spot Ethereum mencapai $138,28 juta, di mana ETHA dan ETHB milik BlackRock masing-masing net inflow sebesar $81,72 juta dan $67,18 juta, beberapa produk Grayscale juga mengalami inflow kecil, sementara FETH Fidelity mengalami net outflow sebesar $35,46 juta. Produk brand lain memiliki inflow nol.

GateNews1jam yang lalu

Citigroup Menurunkan Target Harga BTC dan ETH 12 Bulan ke Depan menjadi $112.000 dan $3.175

Citigroup menurunkan perkiraan harga Bitcoin dan Ethereum selama 12 bulan ke depan karena stagnasi undang-undang pasar cryptocurrency AS, dengan target harga Bitcoin turun menjadi 112.000 dolar AS, dan Ethereum turun menjadi 3.175 dolar AS, serta menurunkan ekspektasi permintaan ETF. Kemajuan regulasi memiliki dampak yang signifikan terhadap pasar.

GateNews2jam yang lalu

Gate Card Pengembalian Dana Tertinggi 5% Menulis Ulang Aturan Pembayaran Kripto, Hadiah Berjenjang Menguntungkan Pengguna Global

Gate baru-baru ini meluncurkan Gate Card terbaru yang menawarkan cashback hingga 5% dan sistem upgrade dual-track, mendukung lebih dari 100 negara dan 130 juta merchant. Pengguna dapat memilih mata uang cashback dan menikmati batas pengeluaran bulanan sebesar 1,5 juta dolar AS, cocok untuk pengguna dengan kekayaan bersih tinggi. Biaya 1% untuk kartu ini dapat dikompensasi oleh cashback dari pengguna tingkat tinggi, sehingga menghasilkan pengembalian positif, dan mendorong pengguna untuk mengumpulkan reward melalui pengeluaran dan peningkatan status VIP.

MarketWhisper2jam yang lalu
Komentar
0/400
Tidak ada komentar