OpenAI و Paradigm يطلقان EVMbench لأمان إيثريوم

ETH‎-2.52%
  • قامت OpenAI و Paradigm ببناء EVMbench استنادًا إلى 120 ثغرة أمنية حقيقية تم اكتشافها خلال عمليات التدقيق.

  • تختبر أدوات الذكاء الاصطناعي في وضع الكشف والتصحيح والاستغلال باستخدام بيئات EVM معزولة.

  • حقق GPT-5.3-Codex نسبة 72.2% في وضع الاستغلال، متفوقًا على نتائج GPT-5 السابقة.

كشفت OpenAI، بالتعاون مع Paradigm، عن معيار جديد لاختبار أداء الذكاء الاصطناعي في أمان العقود الذكية على شبكة إيثريوم. تم الإعلان عن الإصدار هذا الأسبوع، والذي قدم EVMbench كوسيلة لقياس مدى قدرة الوكلاء الذكاء الاصطناعي على اكتشاف وتصحيح واستغلال عيوب العقود. ويهدف هذا الجهد إلى مواجهة المخاطر المتزايدة، حيث تؤمن العقود الذكية أكثر من 100 مليار دولار من الأصول الرقمية عبر شبكات EVM.

معيار مبني على فشل التدقيقات الواقعية

وفقًا لـ OpenAI، يستمد EVMbench من 120 ثغرة عالية الخطورة تم تحديدها عبر 40 عملية تدقيق احترافية للعقود الذكية. ومن الجدير بالذكر أن العديد من هذه المشكلات نشأت من مسابقات التدقيق المفتوحة، بما في ذلك Code4rena. يركز المعيار على الأخطاء الحقيقية بدلاً من الأمثلة الاصطناعية.

بالإضافة إلى ذلك، ذكرت OpenAI أن مجموعة البيانات تتضمن سيناريوهات مرتبطة بأعمال أمنية على شبكة Tempo. تعمل Tempo كشبكة من الطبقة الأولى تركز على المدفوعات، مصممة لنقل العملات المستقرة. لذلك، تقدم هذه الحالات مخاطر منطق الدفع ضمن بيئة الاختبار.

لدعم الاختبارات الواقعية، أعاد المهندسون استخدام نصوص إثبات المفهوم للاستغلال حيثما كانت متاحة. ومع ذلك، قاموا ببناء المكونات المفقودة يدويًا عندما كانت الوثائق غير مكتملة. وقالت OpenAI إنها حافظت على قابلية الاستغلال مع ضمان أن التصحيحات يمكن تجميعها بشكل صحيح.

ثلاث وضعيات اختبار تجهد وكلاء الذكاء الاصطناعي

يقيم EVMbench الوكلاء في وضع الكشف والتصحيح والاستغلال. في وضع الكشف، يقوم الوكلاء بمسح المستودعات وتقييمهم بناءً على مدى استرجاع الثغرات المؤكدة. في وضع التصحيح، يجب على الوكلاء إصلاح العيوب مع الحفاظ على سلوك العقد الأصلي.

أما وضع الاستغلال، فيحاكي هجمات كاملة لتفريغ الأموال داخل بيئة بلوكشين معزولة. ذكرت OpenAI أن المقيمين يؤكدون النتائج من خلال إعادة تشغيل المعاملات وفحوصات الحالة على السلسلة. لضمان الاتساق، أنشأت الشركة أداة تعتمد على Rust لنشر عمليات استنساخ حتمية.

تُجرى اختبارات الاستغلال في بيئة Anvil المحلية، وليس على الشبكات الحية. وأشارت OpenAI إلى أن جميع الثغرات تاريخية ومعلنة علنًا. بالإضافة إلى ذلك، تقيّد الأداة استدعاءات RPC غير الآمنة لتقليل سوء الاستخدام.

النتائج وتوسعة الفريق

في النتائج المعلنة، حقق GPT-5.3-Codex نسبة 72.2% في وضع الاستغلال. بالمقارنة، وصل GPT-5 إلى 31.9%، على الرغم من إطلاقه قبل عدة أشهر. ومع ذلك، ذكرت OpenAI أن تغطية الكشف والتصحيح لا تزال غير مكتملة.

إلى جانب EVMbench، أكدت OpenAI تعيين موظف رئيسي جديد. انضم بيتر ستاينبرغر، مؤسس OpenClaw، إلى الشركة للعمل على تطوير الوكلاء. وأكد سام ألتمان الخبر عبر منصة X، مشيرًا إلى أن ستاينبرغر سيتولى قيادة مشاريع الوكلاء الشخصيين من الجيل التالي.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

过去24小时全网爆仓2.79亿美元,空单爆仓占比超五成

Gate News 消息,3 月 14 日,据 CoinAnk 数据,过去 24 小时全网爆仓 2.79 亿美元,其中多单爆仓 1.32 亿美元,空单爆仓 1.47 亿美元,空单爆仓占比略高。从币种来看,比特币爆仓约 1.28 亿美元,以太坊爆仓约 5892 万美元。

GateNewsمنذ 1 س

Aave 发布 V4 以太坊主网激活治理提案

Gate News 消息,3 月 14 日,Aave 发布 Aave V4 以太坊主网激活治理提案。该版本将引入模块化架构,其中流动性中心(Liquidity Hubs)负责持有共享流动性,Spokes 则定义具有治理限制的独立借贷环境。提案预期将启动拓扑结构、推广路径、实施和控制模型,以及用于风险参数化的初始资产范围。如社区就该提案达成共识,后续将提交 Snapshot 进行投票。

GateNewsمنذ 3 س

V神:以太坊陷入路徑依賴,該從第一性原理重新檢視DeFi、隱私與 L2

Vitalik 呼籲以太坊社群擺脫「路徑依賴」的思維,從第一性原理重新思考 DeFi、隱私和 L2 的角色。他強調應用層的創新,重視隱私和安全,並挑戰傳統觀念,建議在新的視角下創建更具創造力的應用。

CryptoCityمنذ 3 س

鏈上熱到爆、以太幣卻漲不動?專家揭「致命死穴」:恐下探 1,500 美元

CryptoQuant 報告指出,以太坊面臨「採用悖論」,雖然網路活躍度創新高,但幣價卻下滑。若熊市持續,到第三季末以太幣可能跌至 1,500 美元。智能合約活躍度上升與以太幣價格脫鉤,交易所流入量更能反映價格動態。投資需求疲軟,資金持續流失是主要隱憂。

区块客منذ 6 س
تعليق
0/400
لا توجد تعليقات