สาระสำคัญ
OpenAI ได้เปิดตัว EVMbench ระบบทดสอบมาตรฐานใหม่ที่พัฒนาร่วมกับ Paradigm เพื่อทดสอบว่าโมเดล AI ขั้นสูงสามารถตรวจจับ แก้ไข และใช้ช่องโหว่ในสมาร์ทคอนแทรกต์ของ Ethereum ได้อย่างไร
ผลลัพธ์เบื้องต้นเผยให้เห็น “ช่องว่างการโจมตี” โดยโมเดลชั้นนำในปัจจุบันทำการโจมตีได้ดีกว่าการตรวจสอบหรือแก้ไขข้อผิดพลาดอย่างครอบคลุม — เน้นให้เห็นถึงความก้าวหน้าของ AI อย่างรวดเร็วและความเสี่ยงที่กำลังเกิดขึ้น
EVMbench อาจเปลี่ยนแนวมาตรฐานด้านความปลอดภัยของคริปโตเคอเรนซี ให้สามารถตรวจสอบความปลอดภัยด้วย AI อย่างต่อเนื่องสำหรับทีม DeFi และให้ความมั่นใจระดับสถาบันในขณะที่ทรัพย์สินมูลค่าหลายพันล้านเคลื่อนเข้าสู่ระบบบล็อกเชน
ในจุดเปลี่ยนสำคัญของเทคโนโลยีปัญญาประดิษฐ์และบล็อกเชน OpenAI ได้เปิดตัวอย่างเป็นทางการ EVMbench ซึ่งพัฒนาร่วมกับยักษ์ใหญ่ด้านการลงทุนในคริปโต Paradigm ระบบนี้ออกแบบมาเพื่อทดสอบอย่างเข้มงวดว่าเอเจนต์ AI สามารถระบุ ใช้ช่องโหว่ และแก้ไขจุดอ่อนในระบบนิเวศ Ethereum Virtual Machine (EVM) ได้อย่างไร
ด้วยมูลค่าทรัพย์สินคริปโตเปิดเผยในระบบสมาร์ทคอนแทรกต์กว่า 100 พันล้านดอลลาร์ ความเสี่ยงจึงไม่เคยสูงขนาดนี้ EVMbench เป็นการเปลี่ยนแปลงเชิงรุกในการใช้ “โมเดลแนวหน้า” เพื่อปกป้อง DeFi จากภัยคุกคามทางไซเบอร์ที่ซับซ้อนขึ้นเรื่อย ๆ
แหล่งข้อมูล: openai
EVMbench ก้าวข้ามการวิเคราะห์โค้ดแบบคงที่โดยประเมินเอเจนต์ AI ในสามโหมดการทำงานที่มีความเสี่ยงสูงสุด กระบวนการ “ตรวจจับ-แก้ไข-ใช้ช่องโหว่” นี้เลียนแบบเวิร์กโฟลว์ของนักวิจัยด้านความปลอดภัยชั้นนำในโลกจริง
1. โหมดตรวจจับ (The Auditor): เอเจนต์สแกนรีโพซิทอรีโค้ดซับซ้อนเพื่อค้นหาข้อผิดพลาดที่ซ่อนอยู่ ความสำเร็จวัดจาก “การระลึก” — ความสามารถในการค้นหาปัญหา “ความจริงพื้นฐาน” — และรางวัลบั๊กบอนนิติจำลอง
2. โหมดแก้ไข (The Engineer): เมื่อพบบั๊กแล้ว เอเจนต์ต้องเขียนโค้ดใหม่ ระบบจะใช้ชุดทดสอบอัตโนมัติเพื่อให้แน่ใจว่าแพทช์แก้ไขช่องโหว่โดยไม่ทำให้ฟังก์ชันเดิมของสัญญาเสียหาย
3. โหมดโจมตี (The Adversary): ใน sandbox ที่ปลอดภัยและแยกออกจากกัน Anvil เอเจนต์พยายามดำเนินการโจมตีแบบ end-to-end เพื่อระบายเงินทุน ซึ่งวัดความสามารถในการคิดเชิงรุกและการ “เชื่อมต่อ” ข้อผิดพลาดเล็กน้อยให้กลายเป็นการละเมิดร้ายแรง
แหล่งข้อมูล: openai
EVMbench ไม่ได้อิงกับปริศนาทางทฤษฎี แต่สร้างจากคลังข้อมูลที่คัดเลือกมาแล้วของ 120 ช่องโหว่รุนแรงสูง ที่รวบรวมจาก 40 การตรวจสอบเชิงมือ ข้อมูลส่วนใหญ่มาจากการแข่งขันตรวจสอบจริง (เช่น Code4rena) และกระบวนการด้านความปลอดภัยภายในของ Paradigm’s Tempo blockchain
โดยเน้นไปที่ “สมาร์ทคอนแทรกต์ที่เน้นการชำระเงิน” ระบบนี้จึงมั่นใจว่าโมเดล AI ได้รับการทดสอบในสภาพแวดล้อมที่เกี่ยวข้องกับโค้ดที่จัดการกับทรัพย์สินมูลค่าหลายพันล้านดอลลาร์
การทดสอบภายในของ OpenAI เผยให้เห็นความสามารถของ AI ที่เร่งตัวขึ้นอย่างน่าตกใจ ในเวลาเพียงไม่กี่เดือน โมเดลชั้นนำพัฒนาจากการต่อสู้กับตรรกะพื้นฐาน ไปสู่การดำเนินการโจมตีซับซ้อนหลายขั้นตอน
“ช่องว่างการโจมตี”: ที่น่าสนใจคือ เอเจนต์ในปัจจุบันทำงานได้ดีกว่ามากในการ ใช้ช่องโหว่ (72.2%) มากกว่าการ ตรวจจับ หรือ แก้ไข นักวิจัยของ OpenAI สังเกตว่า เอเจนต์ทำได้ดีเมื่อได้รับเป้าหมายชัดเจน เช่น “ระบายเงิน” แต่ต้องการการวิเคราะห์ที่ละเอียดขึ้นเพื่อจัดการกับงานที่ซับซ้อนและละเอียดอ่อน เช่น การตรวจสอบอย่างครอบคลุม
แหล่งข้อมูล: Openai
สำหรับระบบนิเวศคริปโตโดยรวม EVMbench ไม่ใช่แค่คะแนนวัดผล แต่เป็นตัวเร่งให้เกิด “ความปลอดภัยแบบซ้าย” ซึ่งเป็นการบูรณาการการตรวจสอบระดับสูงเข้าไปในกระบวนการเขียนโค้ดโดยไม่ต้องรอการตรวจสอบหลังการใช้งาน
ความปลอดภัยแบบเสรี: ทีม DeFi ขนาดเล็กที่ไม่สามารถจ้างตรวจสอบด้วยมือมูลค่า 200,000 ดอลลาร์ สามารถใช้เอเจนต์ AI ที่ได้รับการรับรองจาก EVMbench สำหรับการตรวจสอบโค้ดอย่างต่อเนื่องและแม่นยำสูง
ความพร้อมของสถาบัน: ขณะที่ยักษ์ใหญ่ด้านการเงินแบบดั้งเดิม เช่น Goldman Sachs และ Franklin Templeton ย้ายเข้าสู่ระบบบล็อกเชน พวกเขาต้องการ “มาตรฐานทองคำ” ของการบริหารจัดการ AI ซึ่งระบบมาตรฐานนี้สามารถให้ได้
ความท้าทายแบบสองด้าน: ด้วยการเปิดซอร์สระบบทดสอบนี้ OpenAI และ Paradigm กำลังให้เครื่องมือแก่ “คนดี” เพื่อวัดและแซงหน้า “คนร้าย” พร้อมทั้งรักษากรอบความเชื่อถือ “Trusted Access for Cyber” เพื่อเฝ้าระวังความเสี่ยงที่เกิดขึ้นใหม่
แม้ว่า EVMbench จะเป็นก้าวสำคัญที่ปฏิวัติวงการ แต่ในปัจจุบันยังจำกัดอยู่ในสภาพแวดล้อมแบบ deterministic และ sandbox คาดว่าเวอร์ชันในอนาคตจะรวมถึง ความขึ้นต่อกันของหลายเครือข่าย และ MEV (Maximal Extractable Value) เพื่อจำลอง “Dark Forest” ของ mainnet Ethereum อย่างสมจริงมากขึ้น
ในขณะที่เอเจนต์ AI กำลังเปลี่ยนจาก “เขียนโค้ด” เป็น “รักษาเศรษฐกิจ” EVMbench จึงเป็นมาตรฐานสำคัญสำหรับอนาคตของการเงินแบบไร้ความเชื่อถือ
คำเตือน: ความคิดเห็นและการวิเคราะห์ในบทความนี้เป็นข้อมูลเพื่อการให้ข้อมูลเท่านั้น ไม่ใช่คำแนะนำด้านการเงิน รูปแบบทางเทคนิคและตัวชี้วัดที่กล่าวถึงอาจมีความผันผวนของตลาดและอาจไม่ให้ผลลัพธ์ตามคาด นักลงทุนควรระมัดระวัง ทำการวิจัยด้วยตนเอง และตัดสินใจตามความเสี่ยงที่ยอมรับได้ของตนเอง
เกี่ยวกับผู้เขียน: Nilesh Hembade เป็นผู้ก่อตั้งและหัวหน้าบรรณาธิการของ Coinsprobe ด้วยประสบการณ์มากกว่า 5 ปีในอุตสาหกรรมคริปโตและบล็อกเชน ตั้งแต่เปิดตัว Coinsprobe ในปี 2023 เขาให้ข้อมูลเชิงลึกรายวันผ่านการวิเคราะห์ตลาดเชิงลึก ข้อมูลบนเชน และการวิจัยเชิงเทคนิค