Штучний інтелект для аудиту виходить у реальну практику, OpenAI випустила EVMbench, посилюючи безпеку оцінки смарт-контрактів

CryptoCity

2026-02-20 04:10:56

ETH-2,52%

WELL-0,35%

OpenAI спільно з Paradigm запускає EVMbench, що тестує здатність AI-агентів до атак і захисту в смарт-контрактах EVM, викриваючи слабкі місця та переваги.

Зосереджуючись на реальних економічних умовах, OpenAI у партнерстві з Paradigm посилює оцінку безпеки блокчейну

Лідер у сфері штучного інтелекту OpenAI оголосив про співпрацю з відомою компанією з ризикових інвестицій у криптовалюти Paradigm та компанією з безпеки OtterSec для запуску базового інструменту EVMbench, який оцінює безпеку AI-агентів у контексті Ethereum Virtual Machine (EVM).

Зі зростанням інтеграції AI та криптотехнологій, смарт-контракти стали ключовою інфраструктурою для управління понад 100 мільярдами відкритих криптоактивів. Вихід цього інструменту символізує початок серйозного ставлення галузі до практичних можливостей AI у «економічно значущих» середовищах.

Команда OpenAI зазначає, що з розвитком здатностей AI-агентів у написанні та плануванні коду, ці моделі у майбутньому відіграватимуть трансформуючу роль у атаках і захисті блокчейнів, тому створення стандартної системи оцінки є надзвичайно важливим для моніторингу прогресу AI.

Три основні режими тестування, 120 реальних вразливостей — випробування для AI

Ядро EVMbench побудоване навколо 120 високоризикових вразливостей, витягнутих із 40 професійних аудитів, зокрема з відомих відкритих конкурсів аудиту Code4rena, що забезпечує реалістичність сценаріїв тестування. Стандарт оцінки оцінює AI-агентів у трьох режимах роботи:

Зображення: Основна концепція EVMbench — оцінка AI-агентів у трьох режимах роботи

Перший — «Режим виявлення (Detect)», коли AI аналізує код контракту та ідентифікує відомі вразливості, оцінюючи їхню серйозність;
Другий — «Режим виправлення (Patch)», де AI має зберегти функціональність контракту, одночасно видаляючи вразливості та виправляючи код;
Третій — «Режим експлуатації (Exploit)», коли AI у ізольованому середовищі імітує атаки з крадіжки коштів.

Щоб забезпечити точність і повторюваність тестів, команда розробила тестову архітектуру на базі Rust, яка використовує детальне відтворення транзакцій для перевірки успішності атак або виправлень AI.

Значний тренд — перевага атак, GPT-5.3-Codex демонструє вражаючий ріст у здатності до атак

Перші результати тестування показали, що AI демонструє значні відмінності у здібностях залежно від завдання. Найновіша модель GPT-5.3-Codex показала високий результат у режимі експлуатації (Exploit Mode) — 72.2 %, що значно перевищує 31.9 %, показані у моделі GPT-5, випущеній лише шість місяців тому, що свідчить про неймовірний прогрес.

Зображення: Огляд результатів різних моделей AI у трьох режимах

Це свідчить про те, що при цілі «повністю вивести кошти» AI має потужні можливості для ітеративного планування та виконання атак. Водночас, у захисних функціях AI показує слабкі результати: у режимі виявлення він часто зупиняється після знаходження однієї помилки, а при складних логіках — важко виправити вразливості без порушення роботи контракту. Експерти з безпеки висловлюють занепокоєння, що AI може значно скоротити час від виявлення вразливості до створення атаки, що ставить під високий ризик DeFi-проєктів і вимагає швидшої реакції.

Привлечение талантів і підтримка захисту — стратегія OpenAI щодо безпеки екосистеми AI-агентів

Крім розробки інструментів, OpenAI активно залучає фахівців і розвиває екосистему захисту. Нещодавно компанія найняла засновника проекту відкритих AI-агентів OpenClaw Пітера Штайнбергера для керівництва розробкою наступного покоління персоналізованих агентів, перетворюючи цей проект у фонд OpenAI.

Щоб протистояти потенційним кіберризикам, OpenAI пообіцяв виділити 10 мільйонів доларів через свою програму підтримки безпеки для фінансування відкритих інструментів захисту та досліджень ключової інфраструктури. Це особливо актуально після інциденту з протоколом Moonwell, де через помилку у коді AI сталася втрата близько 1,78 мільйона доларів.

Додаткові матеріали
Відмова від багатомільярдної пропозиції Meta, приєднання творця OpenClaw до OpenAI — боротьба за таланти, чи все через Vibe Coding? Прогноз Moonwell — збитки на 1,78 мільйона, хто заплатить?

У майбутньому, з появою все більшої кількості AI-помічників для стабільних монет і автоматизованих гаманців, важливо буде використовувати EVMbench для розрізнення моделей, які лише описують вразливості, і тих, що здатні надійно забезпечити захист, що стане ключовим моментом у розвитку галузі безпеки блокчейну.

Переглянути оригінал

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

OpenClaw 发布 v2026.3.13 版本更新，优化移动端体验与浏览器 Agent 能力

Прогрес проєкту

OpenClaw于3月14日发布v2026.3.13稳定版更新，改进了移动端体验和浏览器自动化功能，增强了网关可靠性，新增Chrome DevTools模式和Docker时区变量，同时进行了多项UI/UX改进和安全强化。

GateNews32хв. тому

Pump.fun 推出链上 Agent 实验项目 Tokenized Agents，支持自动回购销毁代币

Прогрес проєкту Події токенів

Pump.fun 联合创始人alon在X平台发布消息，推出首个链上 Agent 实验项目Tokenized Agents，允许用户设置收益回购比例，旨在推动链上代理经济发展。此项目为v0版本，团队将根据社区反馈持续优化。

GateNews1год тому

WLFI 治理质押系统提案投票通过，赞成率达 99.12%

Прогрес проєкту

特朗普家族加密项目World Liberty Financial的WLFI治理质押系统提案已获99.12%赞成通过，旨在鼓励治理参与、将质押作为投票条件、奖励治理贡献，并建立分级节点结构以激励长期参与者。

GateNews1год тому

Aave 发布 V4 以太坊主网激活治理提案

ethereum news Прогрес проєкту

Gate News 消息，3 月 14 日，Aave 发布 Aave V4 以太坊主网激活治理提案。该版本将引入模块化架构，其中流动性中心（Liquidity Hubs）负责持有共享流动性，Spokes 则定义具有治理限制的独立借贷环境。提案预期将启动拓扑结构、推广路径、实施和控制模型，以及用于风险参数化的初始资产范围。如社区就该提案达成共识，后续将提交 Snapshot 进行投票。

GateNews3год тому

AetheriumX 在美成立基金会并获监管牌照，设立生态基金加速亚洲市场拓展

Прогрес проєкту Партнерства та екосистема

AetheriumX于3月14日在美国成立基金会并获监管牌照，推动合规化及全球扩张。基金会将设立生态基金，优先在亚洲拓展，通过资助和合作吸引更多开发团队和项目，增强GameFi与链上应用生态。

GateNews3год тому

OpenClaw 正在微软内部测试，下周将发布 Teams 整合路线图

Прогрес проєкту Партнерства та екосистема

Gate News 消息，3 月 14 日，OpenClaw 创始人 Peter Steinberger 透露，OpenClaw for Microsoft Teams 将迎来重大改进，预计下周将推出路线图。目前已与十几位微软员工进行交流，并组建了一个六人团队正在内部测试 OpenClaw。预计 Microsoft Teams 及其扩展程序和插件将得到改进。

GateNews4год тому

Прокоментувати

0/400

Немає коментарів