PANews informó el 5 de enero que con la llegada de 2026, el campo de seguridad de IA está dando la bienvenida a su primera gran prueba de referencia. LISABench anunció hoy el lanzamiento de su evaluación del primer trimestre de 2026, con el objetivo de determinar el modelo de IA de vanguardia de mejor rendimiento en la detección de vulnerabilidades de Smart Contract de Web3 a través de pruebas del mundo real. Además, LISABench está lanzando simultáneamente un programa de recompensas por predicción mediante votación comunitaria.
Esta evaluación cuenta con una alineación impresionante, reuniendo siete de los mejores modelos de vanguardia del mundo—KIMI K2 (Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhipu AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) y Claude 4.5 Sonnet (Anthropic)—para competir en el mismo escenario.
Actualmente, la votación para las predicciones del ganador del primer trimestre está abierta. Mientras tanto, la base de código de referencia de LISABench ha sido de código abierto en GitHub para que los desarrolladores la revisen y reproduzcan.


