OpenAI และ Paradigm ได้สร้าง EVMbench จากช่องโหว่การตรวจสอบความปลอดภัยในอีเธอเรียมจำนวน 120 รายการ
การทดสอบมาตรฐานนี้ใช้ AI ในโหมดตรวจจับ แก้ไข และโจมตี โดยใช้สภาพแวดล้อม EVM ที่แยกออกเป็น sandbox
GPT-5.3-Codex ทำคะแนนได้ 72.2% ในโหมดโจมตี ซึ่งสูงกว่าผลลัพธ์ของ GPT-5 รุ่นก่อนหน้า
OpenAI ร่วมกับ Paradigm เปิดตัวมาตรฐานใหม่เพื่อทดสอบประสิทธิภาพของ AI ในด้านความปลอดภัยของสมาร์ทคอนแทรกต์บนเครือข่ายอีเธอเรียม การเปิดตัวในสัปดาห์นี้แนะนำ EVMbench เป็นเครื่องมือวัดความสามารถของ AI ในการตรวจจับ แก้ไข และโจมตีข้อบกพร่องของสัญญาอัจฉริยะ ความพยายามนี้มีเป้าหมายเพื่อลดความเสี่ยงที่เพิ่มขึ้น เนื่องจากสมาร์ทคอนแทรกต์มีมูลค่ารวมกว่า 100 พันล้านดอลลาร์ในสินทรัพย์คริปโตบนเครือข่าย EVM
ตามข้อมูลของ OpenAI EVMbench ได้รับข้อมูลจากช่องโหว่ระดับรุนแรงจำนวน 120 รายการ ที่พบในการตรวจสอบสมาร์ทคอนแทรกต์มืออาชีพ 40 ครั้ง ซึ่งหลายรายการมีต้นกำเนิดจากการแข่งขันตรวจสอบแบบเปิด เช่น Code4rena มาตรฐานนี้เน้นที่บั๊กจริงแทนตัวอย่างสมมติ
นอกจากนี้ OpenAI ยังระบุว่าชุดข้อมูลนี้รวมถึงสถานการณ์ที่เกี่ยวข้องกับงานด้านความปลอดภัยบนเครือข่าย Tempo ซึ่งเป็นเครือข่าย Layer-1 สำหรับการโอนเงินสกุลคงที่ เนื่องจากเหตุนี้ กรณีเหล่านี้จึงนำความเสี่ยงด้านตรรกะการชำระเงินเข้าสู่สภาพแวดล้อมของมาตรฐาน
เพื่อสนับสนุนการทดสอบที่สมจริง วิศวกรได้นำสคริปต์พิสูจน์แนวคิดการโจมตีมาใช้ซ้ำในกรณีที่มีอยู่ แต่ได้สร้างส่วนที่ขาดขึ้นมาเองด้วยมือเมื่อเอกสารไม่สมบูรณ์ OpenAI ระบุว่ารักษาความสามารถในการโจมตีไว้ได้ พร้อมทั้งให้แน่ใจว่าการแก้ไขสามารถคอมไพล์ได้อย่างถูกต้อง
EVMbench ประเมินความสามารถของเอเจนต์ในโหมดตรวจจับ แก้ไข และโจมตี ในโหมดตรวจจับ เอเจนต์จะสแกนรีโพสิทอรีและได้รับคะแนนตามความสามารถในการระบุช่องโหว่ที่ยืนยันแล้ว ในโหมดแก้ไข เอเจนต์ต้องแก้ไขข้อบกพร่องโดยรักษาพฤติกรรมเดิมของสัญญาไว้
แต่โหมดโจมตีจะจำลองการโจมตีที่สามารถระบายเงินออกทั้งหมดภายในบล็อกเชน sandbox ซึ่ง OpenAI ระบุว่าผู้ให้คะแนนจะยืนยันผลลัพธ์ผ่านการเล่นธุรกรรมซ้ำและการตรวจสอบสถานะบนเชน เพื่อความสอดคล้องกัน บริษัทได้สร้างเครื่องมือรันด้วยภาษา Rust สำหรับการดีพลอยแบบ deterministic
การทดสอบโจมตีดำเนินการในสภาพแวดล้อม Anvil ท้องถิ่น ไม่ใช่เครือข่ายจริง OpenAI ระบุว่าช่องโหว่ทั้งหมดเป็นข้อมูลในอดีตและเปิดเผยต่อสาธารณะ นอกจากนี้ เครื่องมือยังจำกัดการเรียก RPC ที่ไม่ปลอดภัยเพื่อป้องกันการใช้งานผิดวิธี
จากผลลัพธ์ที่รายงาน GPT-5.3-Codex ทำคะแนนได้ 72.2% ในโหมดโจมตี เมื่อเทียบกับ GPT-5 ที่ทำได้ 31.9% ทั้งที่เปิดตัวหลายเดือนก่อนหน้า อย่างไรก็ตาม OpenAI ระบุว่าการครอบคลุมด้านการตรวจจับและการแก้ไขยังไม่สมบูรณ์
นอกเหนือจาก EVMbench แล้ว OpenAI ยังยืนยันการรับสมัครบุคคลสำคัญ Peter Steinberger ผู้ก่อตั้ง OpenClaw เข้าร่วมงานกับบริษัทเพื่อพัฒนาเอเจนต์ โดย Sam Altman ยืนยันการย้ายงานผ่าน X โดยระบุว่า Steinberger จะเป็นผู้นำโครงการเอเจนต์ส่วนบุคคลรุ่นใหม่
btc.bar.articles
ข้อมูล: เมื่อวานนี้ ETF สินทรัพย์อีเธอร์เรียมในสหรัฐฯ มีการไหลเข้าสุทธิ 22.72 ล้านดอลลาร์
Culper Research ทำการขายชอร์ต ETH, BitMine: Ethereum เข้าสู่ห่วงโซ่ความตาย, Fusaka อัปเกรดค่าธรรมเนียมล่ม 90%
Culper Research ขายชอร์ต Ether และ BitMine โดยอ้างถึงความเสี่ยง 'Death Spiral' ของการอัปเกรด Fusaka
Culper Research ทำการขายชอร์ต Ethereum ชี้ให้การอัปเกรดเป็นสาเหตุของวงจรความตาย
Bitwiseบริจาคเงิน 100,000 ดอลลาร์สหรัฐให้กับนักพัฒนาซอฟต์แวร์เปิดของ Ethereum