OpenAI ได้เปิดตัวกรอบการทดสอบมาตรฐานที่มุ่งวัดประสิทธิภาพของตัวแทน AI ในการตรวจจับ ลดความเสี่ยง และแม้กระทั่งใช้ประโยชน์จากช่องโหว่ด้านความปลอดภัยในสมาร์ทคอนแทรกต์คริปโต โครงการนี้มีชื่อว่า "EVMbench: Evaluating AI Agents on Smart Contract Security" ได้รับการเปิดตัวร่วมกับ Paradigm และ OtterSec ซึ่งเป็นองค์กรสองแห่งที่มีประสบการณ์ลึกซึ้งในด้านความปลอดภัยบลอกเชนและการลงทุน การศึกษานี้ประเมินตัวแทน AI กับชุดจุดอ่อนที่คัดสรรมาแล้ว 120 จุดจาก 40 การตรวจสอบสมาร์ทคอนแทรกต์ โดยแสวงหาการวัดเชิงปริมาณไม่เพียงแค่ความสามารถในการตรวจจับและแก้ไข แต่ยังรวมถึงศักยภาพในการโจมตีเชิงทฤษฎีของตัวแทนเหล่านี้ในสภาพแวดล้อมที่ควบคุมได้
รางวัลการตรวจจับสำหรับตัวแทน AI มีรายละเอียดใน PDF ของ OpenAI ที่แนบมากับการศึกษา ซึ่งอธิบายวิธีการประเมินและสถานการณ์ที่ใช้จำลองความเสี่ยงของสมาร์ทคอนแทรกต์ในโลกจริง ผู้เขียนเน้นว่าแม้ตัวแทน AI จะพัฒนามาเพื่อทำงานประจำหลากหลายประเภทโดยอัตโนมัติ การประเมินประสิทธิภาพของพวกเขาใน "สภาพแวดล้อมที่มีความหมายทางเศรษฐกิจ" เป็นสิ่งสำคัญต่อการเข้าใจว่าพวกเขาจะทำงานอย่างไรภายใต้แรงกดดันในระบบการผลิต
OpenAI ระบุว่าคาดหวังว่าเทคโนโลยีเอเจนท์จะขยายขอบเขตของการชำระเงินและการชำระบัญชี รวมถึงสเตเบิลคอยน์ที่ใช้ในเวิร์กโฟลว์อัตโนมัติ การอภิปรายเกี่ยวกับการชำระเงินที่เปิดใช้งาน AI ขยายเกินกว่าการทดสอบความปลอดภัยไปสู่คำถามที่กว้างขึ้นเกี่ยวกับวิธีที่ระบบอัตโนมัติจะมีส่วนร่วมในกิจกรรมทางการเงินประจำวัน การคาดการณ์ของบริษัทเองชี้ให้เห็นว่าการชำระเงินแบบเอเจนท์อาจกลายเป็นเรื่องปกติมากขึ้น โดยยึดความสามารถของ AI ในกรณีการใช้งานจริงที่สัมผัสถึงธุรกรรมของผู้บริโภคในชีวิตประจำวัน
ควบคู่ไปกับผลการทดสอบมาตรฐาน Jeremy Allaire ซีอีโอของ Circle ได้คาดการณ์ต่อสาธารณะว่าตัวแทน AI หลายพันล้านตัวอาจทำธุรกรรมด้วยสเตเบิลคอยน์สำหรับการชำระเงินประจำวันภายในห้าปีข้างหน้า มุมมองนั้นตัดกับธีมที่เกิดขึ้นซ้ำๆ ในวงการคริปโต: ศักยภาพของคริปโตในการเป็นสกุลเงินดั้งเดิมของตัวแทน AI ซึ่งเป็นเรื่องเล่าที่ได้รับความสนใจอย่างมากจากผู้นำอุตสาหกรรมและนักลงทุน แม้ว่าการคาดการณ์ดังกล่าวยังคงเป็นเรื่องคาดเดา แต่แนวโน้มพื้นฐานก็ชัดเจน—การทำงานอัตโนมัติของ AI กำลังเคลื่อนจากห้องปฏิบัติการสู่ชั้นธุรกรรม ซึ่งอาจปรับเปลี่ยนวิธีการเคลื่อนย้ายมูลค่าข้ามเครือข่าย
การศึกษานี้มาถึงในช่วงเวลาที่ความปลอดภัยคริปโตยังคงเป็นปัจจัยเสี่ยงสำคัญสำหรับนักลงทุน จุดข้อมูลเกี่ยวกับการโจมตีกองทุนคริปโตปี 2025 ซึ่งผู้โจมตียึดเงินไปประมาณ 3.4 พันล้านดอลลาร์ เน้นย้ำถึงความเร่งด่วนของการปรับปรุงเครื่องมือและกลไกการแก้ไขที่เร็วขึ้นและเชื่อถือได้มากขึ้น กรอบการทำงาน EVMbench ถูกจัดวางในส่วนหนึ่งเป็นวิธีวัดว่าตัวแทน AI สามารถมีส่วนร่วมอย่างมีความหมายต่อความสามารถในการป้องกันในระดับใหญ่ ลดโอกาสในการใช้ประโยชน์และเร่งการลดความเสี่ยง
เพื่อสร้างมาตรฐานการทดสอบ นักวิจัยได้ใช้ช่องโหว่ที่คัดสรรแล้ว 120 จุดครอบคลุม 40 การตรวจสอบสมาร์ทคอนแทรกต์ โดยจุดอ่อนหลายจุดสามารถติดตามกลับไปยังความท้าทายการตรวจสอบโอเพนซอร์ส OpenAI โต้แย้งว่ามาตรฐานจะช่วยติดตามความก้าวหน้าของ AI ในการจำและลดจุดอ่อนระดับสัญญาในระดับใหญ่ โดยเสนอวิธีมาตรฐานในการเปรียบเทียบโมเดล AI ในอนาคตเมื่อพวกมันพัฒนา การศึกษายังให้มุมมองว่า AI อาจถูกนำไปใช้กับการทำให้การประเมินความเสี่ยงเป็นมาตรฐานในสถาปัตยกรรมสมาร์ทคอนแทรกต์ที่หลากหลาย แทนที่จะมุ่งเน้นเฉพาะกรณีที่แยกออกมา
ในเธรดร่วมสมัยบน X Haseeb Qureshi พาร์ทเนอร์ที่ Dragonfly โต้แย้งว่าคำมั่นสัญญาของคริปโตในการแทนที่สิทธิในทรัพย์สินและสัญญาแบบดั้งเดิมไม่เคยเป็นจริงไม่ใช่เพราะเทคโนโลยีล้มเหลว แต่เพราะมันไม่เคยถูกออกแบบโดยคำนึงถึงสัญชาตญาณของมนุษย์ เขาได้เน้นความกลัวที่ยังคงอยู่ที่เกี่ยวข้องกับการลงนามธุรกรรมขนาดใหญ่ในสภาพแวดล้อมที่กระเป๋าเงินดูดเงินและเวกเตอร์การโจมตีอื่นๆ ยังคงเป็นภัยคุกคามอย่างต่อเนื่อง ซึ่งตรงกันข้ามอย่างสิ้นเชิงกับประสบการณ์ที่ราบรื่นกว่าของการโอนเงินผ่านธนาคารแบบดั้งเดิม
Qureshi ยืนยันว่าระยะถัดไปของธุรกรรมคริปโตอาจเปิดใช้งานโดยกระเป๋าเงินขับเคลื่อนอัตโนมัติที่มี AI เป็นตัวกลาง กระเป๋าเงินดังกล่าวจะตรวจสอบความเสี่ยง จัดการการดำเนินงานที่ซับซ้อน และตอบสนองต่อภัยคุกคามโดยอัตโนมัติในนามของผู้ใช้ อาจลดความขัดแย้งและความกลัวที่เป็นลักษณะของการโอนขนาดใหญ่ในปัจจุบัน
ประเด็นที่กว้างขึ้นจากเธรดนี้คือตัวแทน AI อาจมีบทบาทสำคัญในการเปลี่ยนแปลงวิธีที่ผู้คนโต้ตอบกับคริปโต—เปลี่ยนจากธุรกรรมด้วยตนเองที่มีข้อผิดพลาดไปสู่กระบวนการอัตโนมัติที่ตระหนักถึงความเสี่ยงซึ่งสามารถขยายขนาดตามการยอมรับ เมื่อตัวแทน AI เริ่มแสดงความสามารถมากขึ้นในการจัดการกับข้อกังวลด้านความปลอดภัย ผู้ใช้อาจเห็นความน่าเชื่อถือและความยืดหยุ่นที่ดีขึ้นในเวิร์กโฟลว์การเงินแบบกระจายอำนาจ แม้ว่าเทคโนโลยีพื้นฐานจะยังคงพัฒนาต่อไป
การศึกษา EVMbench แสดงให้เห็นว่าโมเดลภาษาขนาดใหญ่และตัวแทน AI ที่เกี่ยวข้องกำลังเริ่มทำงานด้านความปลอดภัยที่มีความหมายในพื้นที่สมาร์ทคอนแทรกต์ โดยมีความแตกต่างที่วัดได้ชัดเจนระหว่างโมเดล การนำของ Claude Opus 4.6 ในรางวัลการตรวจจับเฉลี่ยส่งสญญาณว่าสถาปัตยกรรมบางอย่างอาจเชี่ยวชาญมากกว่าในการตรวจจับและลดช่องโหว่ภายในตรรกะสัญญาที่ซับซ้อน ในขณะที่อื่นๆ ตามหลังมา โดยเสนอสเปกตรัมของความสามารถที่นักวิจัยน่าจะต้องการปรับแต่ง การรวมความร่วมมืออุตสาหกรรมหลายรายในโครงการเน้นย้ำถึงฉันทามติที่เพิ่มขึ้นว่าความปลอดภัยที่เปิดใช้งาน AI และการจัดการความเสี่ยงอัตโนมัติอาจกลายเป็นสิ่งจำเป็นสำหรับการขยายขนาดในสภาพแวดล้อมแบบกระจายอำนาจ
เมื่อสาขานี้พัฒนา ผู้สังเกตการณ์จะติดตามว่าตัวแทน AI สามารถเปลี่ยนจากการตรวจจับไปสู่การแก้ไขได้เร็วเพียงใด และตัวแทนเหล่านี้สามารถทำงานได้อย่างน่าเชื่อถือในระบบสดโดยไม่เกิดความเสี่ยงใหม่หรือไม่ การสนทนาเกี่ยวกับกระเป๋าเงินที่ขับเคลื่อนด้วย AI และการชำระเงินอัตโนมัติสัมผัสกับชุดคำถามที่กว้างขึ้นเกี่ยวกับการกำกับดูแลความปลอดภัย ความยินยอมของผู้ใช้ และการจัดตำแหน่งด้านกฎระเบียบ หากวิถีที่แนะนำโดย OpenAI และพันธมิตรยังคงดำเนินต่อไป เครื่องมือที่ช่วยเหลือด้วย AI อาจกลายเป็นองค์ประกอบหลักของโครงสร้างพื้นฐานคริปโตในอนาคต เปลี่ยนแปลงทั้งการคำนวณความเสี่ยงและประสบการณ์ผู้ใช้ในรูปแบบที่มีความหมาย รอบถัดไปของมาตรฐาน ควบคู่กับการปรับใช้ในโลกจริง จะช่วยกำหนดว่าวิสัยทัศน์นี้จะเป็นจริงอย่างรวดเร็วเพียงใดและต้องมีการป้องกันอะไรบ้างที่ต้องมาพร้อมกัน
บทความนี้ได้รับการเผยแพร่ครั้งแรกเป็น OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts บน Crypto Breaking News – แหล่งข้อมูลที่เชื่อถือได้ของคุณสำหรับข่าวคริปโต ข่าว Bitcoin และอัปเดตบลอกเชน


