Os Agentes de IA Podem Aumentar a Segurança do Ethereum? OpenAI e Paradigm Criaram um Ambiente de Teste

ETH2,33%

Resumo

  • O EVMbench testa agentes de IA em 120 vulnerabilidades reais de contratos inteligentes Ethereum.
  • A ferramenta avalia deteção, correção e exploração em três modos distintos.
  • GPT-5.3-Codex alcançou uma taxa de sucesso de 72,2% no modo de exploração.

A OpenAI, criadora do ChatGPT, e a firma de investimento focada em criptomoedas Paradigm apresentaram o EVMbench, uma ferramenta para ajudar a melhorar a segurança dos contratos inteligentes na Ethereum Virtual Machine. O EVMbench foi concebido para avaliar a capacidade de agentes de IA em detectar, corrigir e explorar vulnerabilidades de alta gravidade em contratos inteligentes da Ethereum Virtual Machine (EVM). Os contratos inteligentes são o coração da rede Ethereum, contendo o código que alimenta desde protocolos de finanças descentralizadas até lançamentos de tokens. O número semanal de contratos inteligentes implantados na Ethereum atingiu um máximo histórico de 1,7 milhões em novembro de 2025, com 669.500 implantados apenas na semana passada, segundo a Token Terminal. 

O EVMbench baseia-se em 120 vulnerabilidades selecionadas de 40 auditorias, a maioria provenientes de competições abertas de auditoria, como a Code4rena, segundo um post no blog da OpenAI. Inclui também cenários do processo de auditoria de segurança do Tempo (Tempo), uma blockchain layer-1 criada pela Stripe, focada em pagamentos de stablecoins de alta vazão e baixo custo. A gigante de pagamentos Stripe lançou a testnet pública do Tempo em dezembro, afirmando na altura que ela foi construída com contribuições de Visa, Shopify e OpenAI, entre outros. O objetivo é fundamentar os testes em código do mundo real, economicamente relevante — especialmente à medida que os pagamentos com stablecoins impulsionados por IA se expandem, acrescentou a empresa.

Apresentando o EVMbench — um novo benchmark que mede quão bem agentes de IA podem detectar, explorar e corrigir vulnerabilidades de contratos inteligentes de alta gravidade. https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 18 de fevereiro de 2026

O EVMbench destina-se a avaliar modelos de IA em três modos: Detectar, corrigir e explorar. No modo “detectar”, os agentes auditam repositórios e são avaliados quanto à sua capacidade de identificar vulnerabilidades reais. No modo “corrigir”, os agentes devem eliminar vulnerabilidades sem comprometer a funcionalidade pretendida. Finalmente, na fase “explorar”, os agentes tentam ataques de drenagem de fundos de ponta a ponta num ambiente de blockchain isolado, com avaliação realizada por replay determinístico de transações. No modo de exploração, o GPT-5.3-Codex, executado via CLI do Codex da OpenAI, obteve uma pontuação de 72,2%, em comparação com 31,9% do GPT-5, lançado seis meses antes. O desempenho foi mais fraco nas tarefas de deteção e correção, onde os agentes às vezes não auditavam de forma exaustiva ou tinham dificuldades em preservar toda a funcionalidade do contrato. Os investigadores da OpenAI alertaram que o EVMbench não captura totalmente a complexidade de segurança do mundo real. Ainda assim, acrescentaram que medir o desempenho de IA em ambientes economicamente relevantes é fundamental à medida que os modelos se tornam ferramentas poderosas tanto para atacantes quanto para defensores. Sam Altman, da OpenAI, e Vitalik Buterin, cofundador da Ethereum, já tiveram divergências sobre o ritmo do desenvolvimento de IA. Em janeiro de 2025, Altman afirmou que sua empresa estava “confiante de que sabemos como construir uma IA Geral (AGI) como a entendemos tradicionalmente”. Mas Buterin defendeu que os sistemas de IA deveriam incluir uma capacidade de “pausa suave” que pudesse restringir temporariamente operações de IA em escala industrial, caso surgissem sinais de alerta.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

ETH 15 minutos subiu 1,27%: O fluxo líquido de fundos ETF e o aumento das posições institucionais impulsionam a alta principal.

2026-03-28 13:30 até 13:45 (UTC), o preço à vista do ETH variou entre 2002.78 e 2043.89 USDT, registando um rendimento de +1.27% em 15 minutos, com uma amplitude de 2.05%. Durante este período, a atividade do mercado aumentou significativamente, com um rápido aumento na atenção dos participantes de curto prazo e uma maior volatilidade nos preços. O principal motor deste movimento foi a entrada líquida de fundos em ETFs e o aumento contínuo das posições por parte das instituições. No final de março, os fundos diários para ETFs relacionados ao ETH atingiram impressionantes 175 milhões de dólares, estabelecendo um novo recorde anual, e impulsionando diretamente a curto

GateNews10m atrás

Bitmine Lança MAVAN Com $6,8 Mil Milhões em Ethereum Staked

A Bitmine lançou a plataforma MAVAN para staking institucional de Ethereum, com mais de 3,1 milhões de ETH staked, visando $300M em recompensas anuais. A plataforma foca na segurança e desempenho, planejando expandir para mais redes proof-of-stake.

CryptoFrontNews4h atrás

ETH ultrapassou 2000 USDT, a queda nas últimas 24 horas foi reduzida para 3.07%

Gate News mensagem, 28 de março, segundo o mercado de uma CEX, o ETH ultrapassou 2000 USDT, atualmente cotado a 2000,26 USDT, com a queda nas últimas 24 horas a reduzir-se para 3,07%.

GateNews7h atrás
Comentar
0/400
Nenhum comentário