Son on yıllarda yapay zeka, ağırlıklı olarak aynı kaynakla beslenerek büyüdü.Son on yıllarda yapay zeka, ağırlıklı olarak aynı kaynakla beslenerek büyüdü.

Sınır Verileri ve Fiziksel Yapay Zeka: yapay zekanın yeni altına hücumu (ve blok zincirinin neden vazgeçilmez hale geldiği)

2025/12/04 02:00

在過去十年中,人工智能主要通過吸收同一種資源而成長:公共網絡數據。文本、圖像、文檔、論壇、新聞、博客、資料庫...模型已吸收了大量材料來建立其語言和認知能力。但這個階段即將結束。

根據Messari引用的預測,可用於模型訓練的公共文本總量——約300萬億個標記——可能在2026年至2032年間完全耗盡。這意味著大型模型已經"吃掉了互聯網",現在它們需要其他東西。人工智能的下一個前沿將不再是網絡:而是現實世界。

這就是前沿數據概念發揮作用的地方,這種資源將定義未來模型的競爭力。視頻、音頻、感官、運動、機器人數據、行動數據,以及從與物理世界或複雜數字界面互動中產生的數據。這些數據不能簡單地下載:它們必須被收集、協調、驗證,最重要的是,被激勵。

因此,區塊鏈不是一個細節或邊緣性的附加物:它是使這種新數據經濟協調成為可能的基礎設施。


"網絡爬取"的終結和高價值數據的開始

2025年最先進的模型——不僅是語言模型,還包括多模態、代理型和推理導向型模型——不再僅靠添加通用文本數據集來提升。它們需要更加具體且收集成本更高的東西:反映行動意圖移動互動操作上下文的數據。

例如,電腦使用代理就是這種情況,這種人工智能能夠像人類一樣直接與電腦互動。要訓練這些系統,文本描述是不夠的:需要"軌跡",即人們在屏幕上執行任務的實際記錄。

報告中提到的Chakra協議開發了一個擴展程序,允許用戶在執行日常任務時記錄屏幕:導航管理系統、準備Excel文檔、編輯圖像、使用專業軟件。這些記錄成為訓練像GLADOS-1這樣的模型的寶貴材料,GLADOS-1是第一個幾乎完全基於眾包數據構建的電腦使用模型。

這正是關鍵所在:這些數據在有人產生它們之前是不存在的。而且必須為它們付費。就像為能源或推理付費一樣。


遊戲行動配對的增值

另一個引人注目的例子來自遊戲世界。像Shaga這樣的平台,作為一個去中心化的雲遊戲網絡誕生,產生了極其有價值的副產品:所謂的遊戲行動配對(GAP),即屏幕上發生的事情與玩家發出的命令之間的同步配對。

這些數據不能通過簡單地觀看YouTube上的視頻來獲取:它們需要在源頭,即玩家的設備上捕獲。根據Messari報告的估計,這種類型的數據集每小時遊戲時間的價值可高達50-100美元。

為了說明情況:Shaga已經累積了超過259,000小時的遊戲時間,估計價值超過2600萬美元。而OpenAI在一年前提出5億美元收購Medal,一個專門從事遊戲記錄的類似平台,這也不是巧合。

這些數據用於訓練世界模型,這些模型不僅僅解釋語言,還模擬物理、因果關係和代理-環境互動。這些模型將使更智能的機器人、自主代理、先進的預測系統以及能夠在複雜環境中"移動"的人工智能成為可能。


物理人工智能:智能進入物理世界

這正是我們到達前沿數據第二大浪潮的地方:機器人數據

未來的人工智能不僅存在於數據中心。它將存在於機器人、無人機、自動駕駛汽車、分佈式傳感器和智能家居設備中。每個機器人都需要數據來學習如何移動、識別物體、做出決策和操控環境。而這種數據收集成本極高:它需要物理硬件、遠程操作的人類操作員、持續維護和協調。

像PrismaX、BitRobot、GEODNET和NATIX這樣的項目開始使用Web3典型的激勵機制,將這種成本分散到全球貢獻者網絡中。不是由單一公司收集機器人數據,而是數千名用戶可以協調地這樣做,並獲得直接補償。

這與挖礦的邏輯相同:但這裡的貢獻不是計算能力,而是真實數據


機器對機器協調:當人工智能在現實世界中行動

如果機器人和人工智能代理真正開始與物理世界互動,就需要一個全新的協調層次。機器人將需要:

  • 相互識別,
  • 進行支付交易,
  • 購買服務,
  • 消費數據,
  • 以可驗證的方式執行任務,
  • 證明已執行某項行動,
  • 依賴共享的身份和信譽賬本。

這就是OpenMindPeaq等倡議出現的地方,它們試圖建立一個專用於機器人通信和身份的鏈上基礎設施。相當於DNS,但是為機器設計的。在這個系統中,無人機、自動駕駛汽車、機械臂或工業系統可以發出存在信號、認證其行動、向其他系統付款並交換服務。

這是機器經濟的開始,一個由非人類實體在去中心化網絡上自主互動的經濟。


認證真實數據:IoTeX和DePIN網絡的角色

該報告還重點關注IoTeX,這是一個近年來將其基礎設施轉變為收集、認證和協調現實世界數據的綜合平台的協議。

IoTeX使傳感器、物聯網設備、家庭系統和工業設備的連接成為可能,提供:

  • 每個設備的鏈上驗證身份,
  • 數據聚合系統,
  • 通過ZK進行的加密認證級別,
  • 允許人工智能代理實時利用這些數據的API。

如今,IoTeX協調超過16,000個設備和數十個垂直項目,為人工智能代理提供訪問現實世界已驗證數據的能力。與簡單的爬取相比,這是一個顯著的區別。


終點:數據作為金融資產

根據Messari的說法,軌跡很明確:數據在各方面都正在成為金融資產。就像今天可以投資計算能力、GPU和託管一樣,未來將可以投資"數據流",購買使用權,支持收集前沿數據的網絡,並獲得經濟回報。

這幾乎是不可避免的演變:如果數據變得稀缺、有價值且難以生產,那麼它將擁有市場、價格、需求和供應。

區塊鏈再次成為理想的層次,用於:

  • 協調這種經濟,
  • 驗證其完整性,
  • 追踪來源,
  • 分配補償,
  • 保護用戶,
  • 支持全球可擴展性。

結論

人工智能的進步不會通過越來越大的模型實現,而是通過更豐富的數據,這些數據來自現實世界,並通過全球貢獻者網絡收集。這是下一個十年最大的淘金熱:不是芯片的淘金熱,而是數據的淘金熱。

Web3協議不僅僅是一個細節:它們是收集、驗證、分發和補償那些提供這些數據的人的自然平台。如果說網絡是第一波人工智能浪潮的原材料,那麼現實世界將是第二波的原材料。

而這一次,也是第一次,收集不會由少數巨頭控制,而是由網絡控制。

開放、激勵、去中心化的網絡:前沿數據的新基礎設施。

Sorumluluk Reddi: Bu sitede yeniden yayınlanan makaleler, halka açık platformlardan alınmıştır ve yalnızca bilgilendirme amaçlıdır. MEXC'nin görüşlerini yansıtmayabilir. Tüm hakları telif sahiplerine aittir. Herhangi bir içeriğin üçüncü taraf haklarını ihlal ettiğini düşünüyorsanız, kaldırılması için lütfen service@support.mexc.com ile iletişime geçin. MEXC, içeriğin doğruluğu, eksiksizliği veya güncelliği konusunda hiçbir garanti vermez ve sağlanan bilgilere dayalı olarak alınan herhangi bir eylemden sorumlu değildir. İçerik, finansal, yasal veya diğer profesyonel tavsiye niteliğinde değildir ve MEXC tarafından bir tavsiye veya onay olarak değerlendirilmemelidir.