Tóm tắt ngắn gọn
OpenAI, nhà sáng tạo ChatGPT, và công ty đầu tư tập trung vào tiền điện tử Paradigm đã giới thiệu EVMbench, một công cụ giúp cải thiện an ninh hợp đồng thông minh của Ethereum Virtual Machine. EVMbench được thiết kế để đánh giá khả năng của các tác nhân AI trong việc phát hiện, vá lỗi và khai thác các lỗ hổng nghiêm trọng trong hợp đồng thông minh của Ethereum Virtual Machine (EVM). Hợp đồng thông minh là trung tâm của mạng lưới Ethereum, chứa mã nguồn điều khiển mọi thứ từ các giao thức tài chính phi tập trung đến các đợt phát hành token. Số lượng hợp đồng thông minh được triển khai hàng tuần trên Ethereum đạt mức cao kỷ lục 1,7 triệu vào tháng 11 năm 2025, với 669.500 hợp đồng được triển khai chỉ trong tuần trước, theo Token Terminal.
EVMbench dựa trên 120 lỗ hổng đã được chọn lọc từ 40 cuộc kiểm tra, phần lớn lấy từ các cuộc thi kiểm tra mở như Code4rena, theo một bài đăng trên blog của OpenAI. Nó cũng bao gồm các kịch bản từ quá trình kiểm tra bảo mật cho Tempo, blockchain lớp-1 do Stripe xây dựng nhằm mục đích xử lý thanh toán stablecoin với tốc độ cao và chi phí thấp. Gã khổng lồ thanh toán Stripe đã ra mắt mạng thử nghiệm công khai cho Tempo vào tháng 12, nói rằng dự án này được xây dựng với sự đóng góp từ Visa, Shopify và OpenAI, trong số những đối tác khác. Mục tiêu là dựa trên các mã nguồn thực tế, có ý nghĩa về mặt kinh tế—đặc biệt khi các khoản thanh toán stablecoin dựa trên AI mở rộng, công ty nhấn mạnh.
Giới thiệu EVMbench—một tiêu chuẩn mới đo lường khả năng của các tác nhân AI trong việc phát hiện, khai thác và vá lỗi hợp đồng thông minh có mức độ nghiêm trọng cao. https://t.co/op5zufgAGH
— OpenAI (@OpenAI) ngày 18 tháng 2 năm 2026
EVMbench nhằm đánh giá các mô hình AI qua ba chế độ: Phát hiện, vá lỗi và khai thác. Trong chế độ “phát hiện,” các tác nhân kiểm tra các kho lưu trữ và được chấm điểm dựa trên khả năng ghi nhớ các lỗ hổng thực tế. Trong “vá lỗi,” các tác nhân phải loại bỏ các lỗ hổng mà không làm hỏng chức năng dự kiến. Cuối cùng, trong giai đoạn “khai thác,” các tác nhân cố gắng thực hiện các cuộc tấn công rút tiền từ đầu cuối trong môi trường blockchain cách ly, với điểm số được xác định qua việc tái tạo giao dịch định dạng xác định. Trong chế độ khai thác, GPT-5.3-Codex chạy qua CLI của OpenAI đã đạt điểm 72,2%, so với 31,9% của GPT-5, ra mắt sáu tháng trước đó. Hiệu suất trong các nhiệm vụ phát hiện và vá lỗi thấp hơn, khi các tác nhân đôi khi không kiểm tra toàn diện hoặc gặp khó khăn trong việc duy trì đầy đủ chức năng của hợp đồng. Các nhà nghiên cứu của OpenAI, nhà sáng tạo ChatGPT, cảnh báo rằng EVMbench chưa phản ánh đầy đủ độ phức tạp của an ninh thực tế. Tuy nhiên, họ nhấn mạnh rằng việc đo lường hiệu suất AI trong các môi trường có ý nghĩa kinh tế là rất quan trọng khi các mô hình trở thành công cụ mạnh mẽ cho cả kẻ tấn công và phòng thủ. Sam Altman của OpenAI và đồng sáng lập Ethereum Vitalik Buterin trước đó đã có những bất đồng về tốc độ phát triển AI. Vào tháng 1 năm 2025, Altman nói rằng công ty của ông “tự tin rằng chúng tôi biết cách xây dựng AGI như cách chúng tôi đã hiểu truyền thống.” Nhưng Buterin lại đề xuất rằng các hệ thống AI nên có khả năng “tạm dừng mềm” để có thể hạn chế hoạt động của AI quy mô công nghiệp nếu xuất hiện các dấu hiệu cảnh báo.
Bài viết liên quan
ETH tăng 1,31% trong 15 phút: dòng tiền trên chuỗi chảy vào và độ mua của cá voi lớn đồng pha kéo đà tăng
Bitcoin ETF ghi nhận dòng tiền rút ròng trong ngày trị giá 159,62 triệu USD, trong khi các ETF Ethereum và Solana tiếp tục xu hướng tiêu cực
Nhà phát triển Ethereum Joe Schiarizzi tranh cử với tư cách là một đảng viên Đảng Dân chủ vào vị trí Quốc hội bang Virginia
Grayscale đã chuyển vào một CEX nào đó 5322 ETH và 155.649 BTC, tổng giá trị vượt 22 triệu USD
Anh bạn thân (mối anh) Hoàng Lập Thành đóng vị thế HYPE long, tăng số lượng lệnh long Ethereum lên 12.300 ETH
Trang nhãn hợp đồng của Etherscan được thiết kế lại, thêm trình duyệt mã kiểu IDE