PANews сообщил 5 января, что с наступлением 2026 года сфера безопасности ИИ встречает свой первый крупный эталонный тест. LISABench сегодня объявил о запуске оценки за первый квартал 2026 года, цель которой — определить наиболее эффективную передовую модель ИИ в обнаружении уязвимостей смарт-контрактов Web3 посредством реального тестирования. Кроме того, LISABench одновременно запускает программу вознаграждений за прогнозирование путем голосования сообщества.
Эта оценка может похвастаться впечатляющим составом участников, объединяя семь лучших мировых передовых моделей — KIMI K2 (Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhipu AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) и Claude 4.5 Sonnet (Anthropic) — для соревнования на одной платформе.
В настоящее время открыто голосование за прогнозы победителя первого квартала. Между тем, эталонная кодовая база LISABench была размещена в открытом доступе на GitHub для проверки и воспроизведения разработчиками.


