BlockSec: 人工智能尚无法替代人类进行智能合约审计

Tap Chi Bitcoin

行业报告

2026-03-21 14:02:41

区块链安全公司BlockSec已对由OpenAI和Paradigm开发的名为EVMBench的智能合约AI审计评估标准进行了重新测试。结果显示，面对实际的攻击场景，AI机器人表现明显不佳。

研究团队扩大了测试环境，增加了更多模型配置，同时加入了近期发生的新的安全事件——这些数据此前未曾出现在AI模型的训练数据中。

虽然AI仍无法取代安全专家，但报告强调，机器智能可以自然地作为人类代码审查的辅助工具。

EVMBench初步结果可能过于乐观

此前，EVMBench评估了智能合约安全任务，如漏洞检测、修复和利用，结果被认为非常令人印象深刻。报告显示，AI在120个经过筛选的Code4rena审计样本中，能成功利用72%，并检测出约45%的漏洞。

然而，BlockSec认为，最初的测试条件可能导致结果偏差。联合创始人周亚金表示，团队在使用更多配置和22个实际攻击事件重新测试后，AI的成功利用率为0%。

扩展配置并排除“数据污染”

研究将模型配置数量从14增加到26，通过灵活组合不同“脚手架”与机器人，而不再局限于各供应商的生态系统。研究团队指出，旧的方法难以区分模型性能是源于模型能力还是架构优势。

此外，BlockSec还质疑“数据污染”现象，即EVMBench使用了已公开的漏洞——这些漏洞可能已包含在AI的训练数据中。为此，团队在2026年2月之后发生的22个安全事件上进行了测试，确保超出模型的“知识窗口”。

AI在实际攻击中完全失败

最引人注目的结果是：在110组代理与漏洞的测试中（5个代理面对22个场景），没有任何一次完整的利用成功。这表明，即使是目前最先进的AI，也距离进行实际攻击还很遥远。

不过，在漏洞检测方面，结果仍相对积极。Claude Opus 4.6模型在实际检测中表现最佳，成功发现了13个中的20个漏洞。

常见、熟悉的漏洞AI较易检测，但更复杂的案例几乎完全被遗漏。

未来是AI与人类的合作

研究得出结论：AI尚不能取代人类进行安全审计，更重要的问题是双方如何高效协作。

AI在覆盖范围和大规模扫描能力方面具有优势，而人类在深度分析、协议理解和对抗推理方面更具优势。这两者相辅相成。

BlockSec认为，正确的方向不是用AI取代人类，而是建立双方合作的模型，以实现更全面的审计效果。

查看原文

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

0/400

暂无评论