OpenAI چارچوب معیارسنجی را رونمایی کرده است که هدف آن اندازهگیری میزان اثربخشی AI Agent ها در شناسایی، کاهش و حتی بهرهبرداری از آسیبپذیریهای امنیتی در قرارداد هوشمند کریپتو است. این پروژه با عنوان "EVMbench: ارزیابی AI Agent ها در امنیت قرارداد هوشمند" با همکاری Paradigm و OtterSec، دو سازمان با قرار گرفتن عمیق در امنیت و سرمایهگذاری بلاک چین، منتشر شد. این مطالعه AI Agent ها را در برابر مجموعهای منتخب از 120 نقطه ضعف احتمالی برگرفته از 40 حسابرسی قرارداد هوشمند ارزیابی میکند و به دنبال کمیتسازی نه تنها قابلیتهای شناسایی و اصلاح بلکه پتانسیل بهرهبرداری تئوری این AI Agent ها در یک محیط کنترلشده است.
جوایز شناسایی برای AI Agent ها در PDF OpenAI همراه با مطالعه به تفصیل شرح داده شده است که روششناسی ارزیابی و سناریوهای مورد استفاده برای شبیهسازی ریسک قرارداد هوشمند در دنیای واقعی را نیز توضیح میدهد. نویسندگان تأکید میکنند که در حالی که AI Agent ها برای خودکارسازی طیف گستردهای از وظایف روتین تکامل یافتهاند، ارزیابی عملکرد آنها در "محیطهای اقتصادی معنادار" برای درک نحوه عملکرد آنها تحت فشار در سیستمهای تولید ضروری است.
OpenAI اشاره میکند که انتظار دارد فناوریهای AI Agent دامنه پرداختها و تسویه خودکار را گسترش دهند، از جمله استیبل کوینهای استفادهشده در گردش کارهای خودکار. بحث پیرامون پرداختهای مبتنی بر هوش مصنوعی فراتر از آزمایش امنیتی به سؤال گستردهتر درباره نحوه مشارکت سیستمهای خودکار در فعالیت مالی روزانه گسترش مییابد. پیشبینیهای خود شرکت نشان میدهد که پرداختهای AI Agent میتواند رایجتر شود و قابلیتهای هوش مصنوعی را در موارد استفاده عملی که تراکنشهای مصرفکننده روزمره را لمس میکند، پایهگذاری کند.
همزمان با نتایج معیارسنجی، Jeremy Allaire مدیرعامل Circle بهطور علنی پیشبینی کرده است که میلیاردها AI Agent میتوانند طی پنج سال آینده با استیبل کوین برای پرداختهای روزمره معامله کنند. این دیدگاه با یک موضوع تکرارشونده در حلقههای کریپتو تقاطع دارد: پتانسیل کریپتو برای تبدیل شدن به ارز دیجیتال بومی AI Agent ها، روایتی که توجه قابل توجهی از رهبران صنعت و سرمایهگذاران به خود جلب کرده است. در حالی که چنین پیشبینیهایی حدسی باقی میمانند، روند اساسی روشن است—اتوماسیون هوش مصنوعی از آزمایشگاه به لایه تراکنش در حال حرکت است، جایی که میتواند نحوه حرکت ارزش در شبکهها را تغییر شکل دهد.
این مطالعه در زمانی منتشر میشود که امنیت کریپتو همچنان یک عامل ریسک قابل توجه برای سرمایهگذاران است. نقطه داده درباره حمله به وجوه کریپتو در سال 2025—جایی که مهاجمان تقریباً 3.4 میلیارد دلار را برداشت کردند—فوریت ابزارهای بهبودیافته و مکانیزمهای اصلاح سریعتر و قابل اعتمادتر را برجسته میکند. چارچوب EVMbench تا حدی به عنوان راهی برای اندازهگیری اینکه آیا AI Agent ها میتوانند به طور معناداری به قابلیتهای دفاعی در مقیاس کمک کنند، فرصتهای بهرهبرداری را کاهش داده و کاهش تهدید را تسریع کنند، موقعیتیابی شده است.
برای ساخت معیار، محققان از 120 آسیبپذیری منتخب در 40 حسابرسی قرارداد هوشمند استفاده کردند که بسیاری از نقاط ضعف به چالشهای حسابرسی متنباز بازمیگردند. OpenAI استدلال میکند که این معیار به ردیابی پیشرفت هوش مصنوعی در شناسایی و کاهش نقاط ضعف سطح قرارداد در مقیاس کمک میکند و راهی استاندارد برای مقایسه مدلهای هوش مصنوعی آینده در حال تکامل ارائه میدهد. این مطالعه همچنین دریچهای را در مورد نحوه اعمال هوش مصنوعی برای عادیسازی ارزیابی ریسک در طیف گستردهای از معماریهای قرارداد هوشمند، به جای تمرکز صرف بر موارد جداگانه، ارائه میدهد.
در یک رشته همزمان در X، Haseeb Qureshi، شریک در Dragonfly، استدلال کرد که وعده کریپتو برای جایگزینی حقوق مالکیت و قراردادهای سنتی هرگز محقق نشد، نه به این دلیل که فناوری شکست خورد، بلکه به این دلیل که هرگز با شهود انسانی طراحی نشده بود. او ترس مداوم مرتبط با امضای تراکنشهای بزرگ در محیطی که در آن کیف پولهای تخلیهکننده و سایر بردارهای حمله تهدید مداوم باقی میمانند را برجسته کرده است، که در تضاد کامل با تجربه نسبتاً روانتر انتقال بانکی سنتی است.
Qureshi استدلال میکند که مرحله بعدی تراکنشهای کریپتو میتواند توسط کیف پولهای خودران با واسطه هوش مصنوعی فعال شود. چنین کیف پولهایی ریسک را نظارت میکنند، عملیات پیچیده را مدیریت میکنند و به طور مستقل به تهدیدها از طرف کاربران پاسخ میدهند و به طور بالقوه اصطکاک و ترس را که انتقالهای بزرگ امروز را مشخص میکند، کاهش میدهند.
نکته گستردهتر از این رشته این است که AI Agent ها ممکن است نقش حیاتی در تحول نحوه تعامل مردم با کریپتو ایفا کنند—انتقال از تراکنشهای دستی و مستعد خطا به فرآیندهای خودکار و آگاه از ریسک که میتوانند با پذیرش مقیاس شوند. همانطور که AI Agent ها شروع به نشان دادن شایستگی بیشتر در مدیریت نگرانیهای امنیتی میکنند، کاربران میتوانند قابلیت اطمینان و انعطافپذیری بهبودیافته را در گردش کارهای امور مالی غیر متمرکز با نام اختصاری دیفای ببینند، حتی زمانی که فناوریهای زیرساختی به بلوغ ادامه میدهند.
مطالعه EVMbench نشان میدهد که مدلهای زبانی بزرگ و AI Agent های مرتبط شروع به انجام کار امنیتی معنادار در فضای قرارداد هوشمند کردهاند، با تفاوتهای به وضوح قابل کمیتسازی در بین مدلها. رهبری Claude Opus 4.6 در میانگین جوایز شناسایی نشان میدهد که معماریهای خاص ممکن است در شناسایی و کاهش آسیبپذیریها در منطق قرارداد پیچیده ماهرتر باشند، در حالی که دیگران عقب هستند و طیفی از قابلیتها را ارائه میدهند که محققان احتمالاً میخواهند آن را اصلاح کنند. گنجاندن مشارکتهای متعدد صنعت در این پروژه بر اجماع رو به رشد مبنی بر اینکه امنیت مبتنی بر هوش مصنوعی و مدیریت ریسک خودکار میتواند برای مقیاس در محیطهای غیرمتمرکز ضروری شود، تأکید میکند.
همانطور که این حوزه تکامل مییابد، ناظران مشاهده خواهند کرد که چقدر سریع AI Agent ها میتوانند از شناسایی به اصلاح انتقال یابند و آیا این AI Agent ها میتوانند به طور قابل اعتماد در سیستمهای زنده بدون معرفی ریسکهای جدید عمل کنند. گفتگو درباره کیف پولهای مبتنی بر هوش مصنوعی و پرداختهای خودکار به مجموعه گستردهتری از سؤالات پیرامون حاکمیت امنیتی، رضایت کاربر و هماهنگی نظارتی میپردازد. اگر مسیر پیشنهادی OpenAI و شرکایش ادامه یابد، ابزارهای با کمک هوش مصنوعی میتوانند یک مؤلفه اصلی زیرساخت کریپتو آینده شوند و هم محاسبه ریسک و هم تجربه کاربر را به روشهای معنادار تغییر دهند. دور بعدی معیارها، همراه با استقرارهای دنیای واقعی، به تعیین سرعت تحقق این چشمانداز و اینکه چه پادمانهایی باید آن را همراهی کنند، کمک خواهد کرد.
این مقاله در ابتدا به عنوان OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts در Crypto Breaking News منتشر شد – منبع مورد اعتماد شما برای اخبار کریپتو، اخبار Bitcoin و بهروزرسانیهای بلاک چین.


