OpenAI ha presentado un marco de evaluación destinado a medir la eficacia con la que los agentes de IA pueden detectar, mitigar e incluso explotar vulnerabilidades de seguridad en cryptoOpenAI ha presentado un marco de evaluación destinado a medir la eficacia con la que los agentes de IA pueden detectar, mitigar e incluso explotar vulnerabilidades de seguridad en crypto

OpenAI Enfrenta Agentes de IA Entre Sí para Realizar Pruebas de Penetración en Smart Contracts

2026/02/19 09:26
Lectura de 8 min
Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

OpenAI ha presentado un marco de evaluación comparativa destinado a medir la eficacia con la que los Agentes de IA pueden detectar, mitigar e incluso explotar vulnerabilidades de seguridad en Smart Contracts de criptomonedas. El proyecto, titulado "EVMbench: Evaluating AI Agents on Smart Contract Security", fue lanzado en colaboración con Paradigm y OtterSec, dos organizaciones con amplia experiencia en seguridad e inversión en blockchain. El estudio evalúa a los Agentes de IA frente a un conjunto seleccionado de 120 debilidades potenciales extraídas de 40 Auditorías de contratos inteligentes, buscando cuantificar no solo las capacidades de detección y corrección, sino también el potencial de explotación teórico de estos agentes en un entorno controlado.

Puntos clave

  • EVMbench prueba Agentes de IA contra 120 vulnerabilidades recopiladas de 40 Auditorías de contratos inteligentes, enfatizando vulnerabilidades provenientes de competiciones de auditoría de código abierto.
  • Entre los modelos probados, Claude Opus 4.6 de Anthropic lideró con un premio de detección promedio de $37.824, seguido por OC-GPT-5.2 de OpenAI con $31.623 y Gemini 3 Pro de Google con $25.112.
  • OpenAI presenta el benchmark como un paso hacia la medición del rendimiento de la IA en "entornos económicamente significativos", no solo en tareas de prueba, destacando las implicaciones del mundo real para atacantes y defensores en el panorama de seguridad cripto.
  • Los investigadores señalan que los Smart Contracts protegen miles de millones de dólares en activos, subrayando el valor estratégico de las herramientas habilitadas por IA tanto para actividades ofensivas como defensivas.
  • Los observadores de la industria han vinculado estos desarrollos a discusiones más amplias sobre pagos impulsados por IA y el papel de las Stablecoins en las transacciones cotidianas, con importantes ejecutivos prediciendo un uso agéntico creciente en los próximos años.
  • El contexto de este trabajo se subraya con los datos de incidentes de seguridad cripto de 2025, que muestran un flujo continuo de fondos a través de vulnerabilidades y ataques, reforzando la demanda de mecanismos robustos de auditoría y defensa habilitados por IA.

Los premios de detección para Agentes de IA se detallan en el PDF de OpenAI que acompaña el estudio, que también describe la metodología de evaluación y los escenarios utilizados para simular el riesgo de Smart Contracts del mundo real. Los autores enfatizan que aunque los Agentes de IA han evolucionado para automatizar una amplia gama de tareas rutinarias, evaluar su rendimiento en "entornos económicamente significativos" es esencial para comprender cómo se desempeñarán bajo presión en sistemas de producción.

OpenAI señala que espera que las tecnologías agénticas amplíen el alcance de los pagos y liquidaciones, incluyendo Stablecoins utilizadas en flujos de trabajo automatizados. La discusión sobre pagos habilitados por IA se extiende más allá de las pruebas de seguridad a la cuestión más amplia de cómo los sistemas autónomos participarán en la actividad financiera diaria. Las propias proyecciones de la compañía sugieren que los pagos agénticos podrían volverse más comunes, fundamentando las capacidades de IA en casos de uso prácticos que tocan las transacciones cotidianas de los consumidores.

Junto con los resultados del benchmark, el CEO de Circle, Jeremy Allaire, ha pronosticado públicamente que miles de millones de Agentes de IA podrían estar realizando transacciones con Stablecoins para pagos cotidianos en los próximos cinco años. Esa visión se cruza con un tema recurrente en los círculos cripto: el potencial de que la cripto se convierta en la moneda nativa de los Agentes de IA, una narrativa que ha ganado notable atención de líderes de la industria e inversores por igual. Aunque tales predicciones siguen siendo especulativas, la tendencia subyacente es clara: la automatización de IA está pasando del laboratorio a la capa de transacción, donde podría remodelar cómo se mueve el valor a través de las redes.

El estudio llega en un momento en que la seguridad cripto continúa siendo un factor de riesgo significativo para los inversores. El punto de datos sobre el asalto a fondos cripto en 2025, donde los atacantes extrajeron aproximadamente $3.400 millones, destaca la urgencia de mejorar las herramientas y los mecanismos de corrección más rápidos y fiables. El marco EVMbench se posiciona, en parte, como una forma de medir si los Agentes de IA pueden contribuir significativamente a las capacidades defensivas a escala, reduciendo las oportunidades de explotación y acelerando la mitigación de amenazas.

Para construir el benchmark, los investigadores se basaron en 120 vulnerabilidades seleccionadas que abarcan 40 Auditorías de contratos inteligentes, con muchas debilidades rastreadas hasta desafíos de auditoría de código abierto. OpenAI argumenta que el benchmark ayudará a rastrear el progreso de la IA en reconocer y mitigar debilidades a nivel de contrato a escala, ofreciendo una forma estandarizada de comparar futuros modelos de IA a medida que evolucionan. El estudio también proporciona una perspectiva sobre cómo la IA podría aplicarse para normalizar la evaluación de riesgo en una amplia gama de arquitecturas de Smart Contracts, en lugar de enfocarse únicamente en casos aislados.

Los Smart Contracts no fueron construidos para humanos: Dragonfly

En un hilo contemporáneo en X, Haseeb Qureshi, socio de Dragonfly, argumentó que la promesa de la cripto de reemplazar los derechos de propiedad y los contratos tradicionales nunca se materializó no porque la tecnología fallara, sino porque nunca fue diseñada con la intuición humana en mente. Ha destacado el miedo persistente asociado con la firma de transacciones grandes en un entorno donde las billeteras drenantes y otros vectores de ataque siguen siendo una amenaza constante, en marcado contraste con la experiencia comparativamente más fluida de las transferencias bancarias tradicionales.

Qureshi sostiene que la próxima fase de transacciones cripto podría ser habilitada por billeteras autoconducidas intermediadas por IA. Tales billeteras monitorearían el riesgo, gestionarían operaciones complejas y responderían autónomamente a amenazas en nombre de los usuarios, reduciendo potencialmente la fricción y el miedo que caracterizan las transferencias grandes hoy en día.

La conclusión más amplia de este hilo es que los Agentes de IA pueden desempeñar un papel crítico en transformar cómo las personas interactúan con cripto, pasando de transacciones manuales propensas a errores a procesos automatizados conscientes del riesgo que pueden escalar con la adopción. A medida que los Agentes de IA comienzan a demostrar mayor competencia en el manejo de preocupaciones de seguridad, los usuarios podrían ver una confiabilidad y resistencia mejoradas en los flujos de trabajo de finanzas descentralizadas, incluso mientras las tecnologías subyacentes continúan madurando.

Qué observar a continuación

  • Publicación y replicación independiente del conjunto de datos completo de EVMbench en modelos y arquitecturas de IA adicionales.
  • Adopción más amplia de flujos de trabajo de auditoría asistidos por IA por parte de auditores, exchanges y proyectos DeFi que buscan reforzar las posturas de seguridad.
  • Exploraciones en billeteras agénticas y flujos de pago autónomos, incluidas consideraciones regulatorias y de cumplimiento para activos gestionados por IA.
  • Benchmarks de seguimiento que comparan más sistemas de IA a medida que se lanzan nuevas versiones, rastreando mejoras en la precisión de detección y la velocidad de corrección.

Fuentes y verificación

  • OpenAI: EVMbench: Evaluating AI Agents on Smart Contract Security — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: Introducing EVMbench — https://openai.com/index/introducing-evmbench/
  • Pérdidas de seguridad cripto en 2025 (cobertura de informes): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Haseeb Qureshi sobre IA y UX cripto (publicación en X): https://x.com/hosseeb/status/2024136762424185208
  • Liderazgo de IA de China e implicaciones cripto (análisis): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw y desarrollos de bots de IA en cobertura de Polymarket: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Cifras clave y próximos pasos

El estudio EVMbench demuestra que los modelos de lenguaje grandes y los Agentes de IA relacionados están comenzando a realizar trabajo de seguridad significativo en el espacio de Smart Contracts, con diferencias claramente cuantificables entre modelos. El liderazgo de Claude Opus 4.6 en premios de detección promedio señala que ciertas arquitecturas pueden ser más hábiles para detectar y mitigar vulnerabilidades dentro de la lógica compleja de contratos, mientras que otras van rezagadas, ofreciendo un espectro de capacidades que los investigadores probablemente querrán refinar. La inclusión de múltiples asociaciones de la industria en el proyecto subraya el creciente consenso de que la seguridad habilitada por IA y la gestión automatizada de riesgos podrían volverse esenciales para escalar en entornos descentralizados.

A medida que el campo evoluciona, los observadores estarán atentos a qué tan rápido los Agentes de IA pueden transitar de la detección a la remediación, y si estos agentes pueden operar de manera confiable en sistemas en vivo sin introducir nuevos riesgos. La conversación sobre billeteras impulsadas por IA y pagos autónomos toca un conjunto más amplio de preguntas en torno a la gobernanza de seguridad, el consentimiento del usuario y la alineación regulatoria. Si la trayectoria sugerida por OpenAI y sus socios continúa, las herramientas asistidas por IA podrían convertirse en un componente central de la futura infraestructura cripto, cambiando tanto el cálculo de riesgo como la experiencia del usuario de maneras significativas. La próxima ronda de benchmarks, junto con implementaciones del mundo real, ayudará a determinar qué tan rápido se materializa esta visión y qué salvaguardas deben acompañarla.

Este artículo fue publicado originalmente como OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts en Crypto Breaking News, tu fuente confiable de noticias cripto, noticias de Bitcoin y actualizaciones de blockchain.

Oportunidad de mercado
Logo de Smart Blockchain
Precio de Smart Blockchain(SMART)
$0.004393
$0.004393$0.004393
-2.00%
USD
Gráfico de precios en vivo de Smart Blockchain (SMART)
Aviso legal: Los artículos republicados en este sitio provienen de plataformas públicas y se ofrecen únicamente con fines informativos. No reflejan necesariamente la opinión de MEXC. Todos los derechos pertenecen a los autores originales. Si consideras que algún contenido infringe derechos de terceros, comunícate a la dirección service@support.mexc.com para solicitar su eliminación. MEXC no garantiza la exactitud, la integridad ni la actualidad del contenido y no se responsabiliza por acciones tomadas en función de la información proporcionada. El contenido no constituye asesoría financiera, legal ni profesional, ni debe interpretarse como recomendación o respaldo por parte de MEXC.