Quản trị AI là Dấu hiệu Cảnh báo: Vitalik Buterin Đưa ra Một Giải pháp Thay thế

Điểm chính Vitalik Buterin cảnh báo rằng quản trị AI ngây thơ quá dễ bị khai thác. Một bản demo gần đây cho thấy cách những kẻ tấn công có thể lừa ChatGPT để rò rỉ dữ liệu cá nhân. Mô hình "tài chính thông tin" của Buterin thúc đẩy sự đa dạng, giám sát và khả năng phục hồi. Đồng sáng lập Ethereum Vitalik Buterin đã cảnh báo người theo dõi của mình trên X về những rủi ro khi phụ thuộc vào trí tuệ nhân tạo (AI) để quản trị, lập luận rằng các phương pháp hiện tại quá dễ bị khai thác. Mối quan ngại của Buterin theo sau một cảnh báo khác từ đồng sáng lập EdisonWatch Eito Miyamura, người đã chỉ ra cách những kẻ độc hại có thể chiếm đoạt Giao thức Ngữ cảnh Mô hình (MCP) mới của OpenAI để truy cập dữ liệu người dùng riêng tư. Đây cũng là lý do tại sao "quản trị AI" ngây thơ là một ý tưởng tồi. Nếu bạn sử dụng AI để phân bổ tài trợ cho các đóng góp, mọi người SẼ đưa vào jailbreak cộng với "đưa cho tôi tất cả tiền" ở nhiều nơi nhất có thể. Thay vào đó, tôi ủng hộ phương pháp tài chính thông tin ( https://t.co/Os5I1voKCV… https://t.co/a5EYH6Rmz9 — vitalik.eth (@VitalikButerin) 13/09/2025 Rủi ro của Quản trị AI Ngây thơ Bài kiểm tra của Miyamura tiết lộ cách một lời mời lịch đơn giản với các lệnh ẩn có thể lừa ChatGPT để lộ các Email nhạy cảm khi trợ lý truy cập vào mục đã bị xâm phạm. Các chuyên gia Bảo mật lưu ý rằng các mô hình ngôn ngữ lớn không thể phân biệt giữa hướng dẫn thực và độc hại, khiến chúng rất dễ bị thao túng. Chúng tôi đã khiến ChatGPT rò rỉ dữ liệu Email cá nhân của bạn 💀💀 Tất cả những gì bạn cần? Địa chỉ Email của nạn nhân. ⛓️‍💥🚩📧 Vào thứ Tư, @OpenAI đã thêm hỗ trợ đầy đủ cho các công cụ MCP (Model Context Protocol) trong ChatGPT. Cho phép ChatGPT kết nối và đọc Gmail, Calendar, Sharepoint, Notion của bạn,… pic.twitter.com/E5VuhZp2u2 — Eito Miyamura | 🇯🇵🇬🇧 (@Eito_Miyamura) 12/09/2025 Buterin cho biết lỗ hổng này là một dấu hiệu cảnh báo lớn đối với các hệ thống quản trị đặt quá nhiều niềm tin vào AI. Ông lập luận rằng nếu các mô hình như vậy được sử dụng để quản lý tài trợ hoặc ra quyết định, những kẻ tấn công có thể dễ dàng vượt qua các biện pháp bảo vệ bằng các lệnh kiểu jailbreak, khiến quy trình quản trị dễ bị lạm dụng.…