A OpenAI revelou uma estrutura de benchmarking destinada a medir a eficácia com que os Agentes de IA conseguem detetar, mitigar e até explorar vulnerabilidades de segurança em contratos inteligentes cripto. O projeto, intitulado "EVMbench: Evaluating AI Agents on Smart Contract Security", foi lançado em colaboração com a Paradigm e a OtterSec, duas organizações com profunda exposição à segurança e investimento em blockchain. O estudo avalia Agentes de IA contra um conjunto selecionado de 120 potenciais fraquezas extraídas de 40 auditorias de contrato inteligente, procurando quantificar não apenas as capacidades de deteção e correção, mas também o potencial de exploração teórico destes agentes num ambiente controlado.
As recompensas de deteção para Agentes de IA são detalhadas no PDF da OpenAI que acompanha o estudo, que também descreve a metodologia de avaliação e os cenários usados para simular o risco de contrato inteligente do mundo real. Os autores enfatizam que, embora os Agentes de IA tenham evoluído para automatizar uma ampla gama de tarefas de rotina, avaliar o seu desempenho em "ambientes economicamente significativos" é essencial para compreender como irão funcionar sob pressão em sistemas de produção.
A OpenAI observa que espera que as tecnologias agênticas ampliem o âmbito dos pagamentos e liquidação, incluindo stablecoins usadas em fluxos de trabalho automatizados. A discussão em torno dos pagamentos habilitados por IA estende-se para além dos testes de segurança à questão mais ampla de como os sistemas autónomos irão participar na atividade financeira diária. As próprias projeções da empresa sugerem que os pagamentos agênticos poderão tornar-se mais comuns, fundamentando as capacidades da IA em casos de uso práticos que tocam as transações quotidianas dos consumidores.
Em conjunto com os resultados do benchmark, o CEO da Circle, Jeremy Allaire, previu publicamente que milhares de milhões de Agentes de IA poderão estar a transacionar com stablecoins para pagamentos quotidianos nos próximos cinco anos. Essa visão cruza-se com um tema recorrente nos círculos cripto: o potencial das criptomoedas para se tornarem a moeda nativa dos Agentes de IA, uma narrativa que ganhou atenção notável de líderes da indústria e investidores. Embora tais previsões permaneçam especulativas, a tendência subjacente é clara — a automação de IA está a mover-se do laboratório para a camada de transação, onde poderá remodelar a forma como o valor se move através das redes.
O estudo surge num momento em que a segurança cripto continua a ser um fator de risco significativo para os investidores. O dado sobre o ataque aos fundos cripto de 2025 — onde os atacantes retiraram aproximadamente $3,4 mil milhões — destaca a urgência de ferramentas melhoradas e mecanismos de correção mais rápidos e fiáveis. A estrutura EVMbench está posicionada, em parte, como uma forma de medir se os Agentes de IA podem contribuir significativamente para as capacidades defensivas em escala, reduzindo oportunidades de exploração e acelerando a mitigação de ameaças.
Para construir o benchmark, os investigadores basearam-se em 120 vulnerabilidades selecionadas abrangendo 40 auditorias de contrato inteligente, com muitas fraquezas rastreadas até desafios de auditoria de código aberto. A OpenAI argumenta que o benchmark ajudará a acompanhar o progresso da IA no reconhecimento e mitigação de fraquezas ao nível do contrato em escala, oferecendo uma forma padronizada de comparar futuros modelos de IA à medida que evoluem. O estudo também fornece uma perspetiva sobre como a IA pode ser aplicada à normalização da avaliação de risco através de uma ampla gama de arquiteturas de contrato inteligente, em vez de se concentrar apenas em casos isolados.
Numa sequência contemporânea no X, Haseeb Qureshi, um parceiro da Dragonfly, argumentou que a promessa da cripto de substituir direitos de propriedade e contratos tradicionais nunca se materializou, não porque a tecnologia falhou, mas porque nunca foi concebida com a intuição humana em mente. Ele destacou o medo persistente associado à assinatura de grandes transações num ambiente onde carteiras de drenagem e outros vetores de ataque permanecem uma ameaça constante, em forte contraste com a experiência comparativamente mais suave das transferências bancárias tradicionais.
Qureshi defende que a próxima fase das transações cripto poderá ser habilitada por carteiras auto-conduzidas intermediadas por IA. Tais carteiras monitorizariam o risco, geririam operações complexas e responderiam autonomamente a ameaças em nome dos utilizadores, potencialmente reduzindo a fricção e o medo que caracterizam grandes transferências hoje.
A conclusão mais ampla desta sequência é que os Agentes de IA podem desempenhar um papel crítico na transformação da forma como as pessoas interagem com cripto — mudando de transações manuais propensas a erros para processos automatizados e conscientes do risco que podem escalar com a adoção. À medida que os Agentes de IA começam a demonstrar mais competência no tratamento de questões de segurança, os utilizadores poderão ver fiabilidade e resiliência melhoradas em fluxos de trabalho de finanças descentralizadas, mesmo enquanto as tecnologias subjacentes continuam a amadurecer.
O estudo EVMbench demonstra que grandes modelos de linguagem e Agentes de IA relacionados estão a começar a realizar trabalho de segurança significativo no espaço de contratos inteligentes, com diferenças claramente quantificáveis entre modelos. A liderança do Claude Opus 4.6 nas recompensas médias de deteção sinaliza que certas arquiteturas podem ser mais hábeis em detetar e mitigar vulnerabilidades dentro da lógica de contrato complexa, enquanto outras ficam para trás, oferecendo um espectro de capacidades que os investigadores provavelmente desejarão refinar. A inclusão de múltiplas parcerias da indústria no projeto sublinha o consenso crescente de que a segurança habilitada por IA e o gerenciamento de risco automatizado poderão tornar-se essenciais para escalar em ambientes descentralizados.
À medida que o campo evolui, os observadores estarão a observar a rapidez com que os Agentes de IA podem fazer a transição da deteção para a remediação, e se estes agentes podem operar de forma fiável em sistemas ao vivo sem introduzir novos riscos. A conversa sobre carteiras impulsionadas por IA e pagamentos autónomos toca num conjunto mais amplo de questões em torno da governança de segurança, consentimento do utilizador e alinhamento regulamentar. Se a trajetória sugerida pela OpenAI e seus parceiros continuar, as ferramentas assistidas por IA poderão tornar-se um componente central da futura infraestrutura cripto, alterando tanto o cálculo de risco como a experiência do utilizador de formas significativas. A próxima ronda de benchmarks, juntamente com implementações do mundo real, ajudará a determinar a rapidez com que esta visão se materializa e que salvaguardas devem acompanhá-la.
Este artigo foi originalmente publicado como OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts no Crypto Breaking News – a sua fonte de confiança para notícias cripto, notícias Bitcoin e atualizações blockchain.


