في العقد الماضي، نما الذكاء الاصطناعي من خلال التغذية بشكل أساسي على نفس المورد: بيانات الويب العامة. النصوص والصور والمستندات والمنتديات والأخبار والمدونات والمستودعات... كمية هائلة من المواد التي استوعبتها النماذج لبناء قدراتها اللغوية والإدراكية. لكن هذه المرحلة على وشك الانتهاء.
وفقًا للتوقعات التي استشهدت بها Messari، فإن إجمالي كمية النص العام المتاح لتدريب النماذج - حوالي 300 تريليون رمز - يمكن أن ينفد تمامًا بين عامي 2026 و2032. وهذا يعني أن النماذج الكبيرة قد "التهمت الإنترنت"، والآن تحتاج إلى شيء آخر. لن تكون الحدود التالية للذكاء الاصطناعي هي الويب: بل ستكون العالم الحقيقي.
وهنا يأتي دور مفهوم بيانات الحدود، المورد الذي سيحدد تنافسية النماذج المستقبلية. الفيديو والصوت والبيانات الحسية والحركية والروبوتية وبيانات الإجراءات والبيانات الناتجة عن التفاعل مع العالم المادي أو واجهات رقمية معقدة. بيانات لا يمكن تنزيلها ببساطة: يجب جمعها وتنسيقها والتحقق منها، وقبل كل شيء، تحفيزها.
لهذا السبب، فإن البلوكشين ليس مجرد تفصيل أو إضافة هامشية: إنه البنية التحتية التي تمكّن من تنظيم اقتصاد البيانات الجديد هذا.
النماذج الأكثر تقدمًا لعام 2025 - ليست لغوية فقط بل أيضًا متعددة الوسائط ووكيلية وموجهة نحو التفكير - لم تعد تتحسن بمجرد إضافة مجموعات بيانات نصية عامة. إنها تتطلب شيئًا أكثر تحديدًا وأكثر تكلفة للجمع: بيانات تعكس الإجراءات، النوايا، الحركة، التفاعل، التلاعب، السياق.
هذا هو الحال، على سبيل المثال، مع وكلاء استخدام الكمبيوتر، الذكاء الاصطناعي القادر على التفاعل مباشرة مع الكمبيوتر كما يفعل الإنسان. لتدريب هذه الأنظمة، لا تكفي الأوصاف النصية: هناك حاجة إلى "مسارات"، وهي تسجيلات فعلية للأشخاص الذين يؤدون مهام على الشاشة.
طور بروتوكول مثل Chakra، المذكور في التقرير، امتدادًا يسمح للمستخدمين بتسجيل شاشتهم أثناء أداء المهام اليومية: التنقل في نظام إدارة، وإعداد مستند Excel، وتحرير الصور، واستخدام البرامج المهنية. تصبح هذه التسجيلات مادة لا تقدر بثمن لتدريب نماذج مثل GLADOS-1، أول نموذج لاستخدام الكمبيوتر تم بناؤه تقريبًا بالكامل على بيانات جماعية المصدر.
وهذه هي النقطة بالضبط: هذه البيانات لا توجد حتى ينتجها شخص ما. ويجب دفع ثمنها. تمامًا مثل الطاقة أو الاستدلال.
يأتي مثال آخر مثير للإعجاب من عالم الألعاب. تنتج منصة مثل Shaga، التي ولدت كشبكة ألعاب سحابية لامركزية، منتجًا ثانويًا قيّمًا للغاية: ما يسمى بـ أزواج اللعب والإجراءات (GAP)، وهي أزواج متزامنة لما يحدث على الشاشة والأوامر التي يصدرها اللاعب.
هذه بيانات لا يمكن استردادها ببساطة من خلال مشاهدة مقاطع الفيديو على YouTube: يجب التقاطها من المصدر، على جهاز اللاعب. ووفقًا للتقديرات التي أوردتها Messari، يمكن أن تصل قيمة هذا النوع من مجموعات البيانات إلى 50-100 دولار لكل ساعة من اللعب.
لوضع ذلك في السياق: لقد جمعت Shaga بالفعل أكثر من 259,000 ساعة من اللعب، بقيمة تقديرية تزيد عن 26 مليون دولار. وليس من قبيل الصدفة أن OpenAI، قبل عام، عرضت نصف مليار للاستحواذ على Medal، وهي منصة مماثلة متخصصة تحديدًا في تسجيل اللعب.
تُستخدم هذه البيانات لتدريب نماذج العالم، وهي نماذج لا تفسر اللغة فحسب، بل تحاكي الفيزياء والسببية والتفاعل بين الوكيل والبيئة. هذه هي النماذج التي ستمكّن الروبوتات الأكثر ذكاءً، والوكلاء المستقلين، وأنظمة التنبؤ المتقدمة، والذكاء الاصطناعي القادر على "التحرك" في بيئات معقدة.
وهنا بالضبط نصل إلى الموجة الرئيسية الثانية من بيانات الحدود: البيانات الروبوتية.
لن يقتصر الذكاء الاصطناعي في المستقبل على مراكز البيانات فقط. سيعيش في الروبوتات والطائرات بدون طيار والسيارات ذاتية القيادة وأجهزة الاستشعار الموزعة وأجهزة المنزل الذكية. سيحتاج كل روبوت إلى بيانات ليتعلم كيفية التحرك وتحديد الأشياء واتخاذ القرارات والتلاعب بالبيئات. وجمع هذه البيانات مكلف بشكل لا يصدق: فهو يتطلب أجهزة مادية ومشغلين بشريين للتشغيل عن بعد وصيانة مستمرة وتنسيق.
بدأت مشاريع مثل PrismaX وBitRobot وGEODNET وNATIX في استخدام آليات التحفيز النموذجية لـ Web3 لتوزيع هذه التكلفة عبر شبكة عالمية من المساهمين. بدلاً من وجود شركة واحدة تجمع البيانات الروبوتية، يمكن لآلاف المستخدمين القيام بذلك بطريقة منسقة، وتلقي تعويض مباشر.
إنه نفس منطق التعدين: ولكن بدلاً من القوة الحسابية، هنا المساهمة هي البيانات الحقيقية.
إذا بدأت الروبوتات ووكلاء الذكاء الاصطناعي حقًا في التفاعل مع العالم المادي، فهناك حاجة إلى مستوى جديد تمامًا من التنسيق. ستحتاج الروبوتات إلى:
هنا تظهر مبادرات مثل OpenMind وPeaq، التي تحاول بناء بنية تحتية على السلسلة مخصصة للتواصل وهوية الروبوتات. ما يعادل DNS، ولكن للآلات. نظام يمكن فيه للطائرات بدون طيار والسيارات ذاتية القيادة والأذرع الروبوتية أو الأنظمة الصناعية الإشارة إلى وجودها، وتصديق إجراءاتها، ودفع أنظمة أخرى، وتبادل الخدمات.
إنها بداية اقتصاد الآلات، وهو اقتصاد مأهول بكيانات غير بشرية تتفاعل بشكل مستقل على شبكات لامركزية.
يركز التقرير أيضًا بشكل كبير على IoTeX، وهو بروتوكول حول في السنوات الأخيرة بنيته التحتية إلى منصة شاملة لجمع وتصديق وتنظيم بيانات العالم الحقيقي.
يمكّن IoTeX من توصيل أجهزة الاستشعار وأجهزة إنترنت الأشياء وأنظمة المنزل والمعدات الصناعية، مما يوفر:
اليوم، ينسق IoTeX أكثر من 16,000 جهاز وعشرات المشاريع العمودية، مما يوفر لوكلاء الذكاء الاصطناعي القدرة على الوصول إلى بيانات تم التحقق منها من العالم الحقيقي. فرق كبير مقارنة بالكشط البسيط.
وفقًا لـ Messari، المسار واضح: البيانات تتحول إلى أصل مالي من كل النواحي. تمامًا كما يمكن للمرء اليوم الاستثمار في الحوسبة ووحدات معالجة الرسومات والموقع المشترك، في المستقبل سيكون من الممكن الاستثمار في "تدفقات البيانات"، وشراء حقوق الاستخدام، ودعم الشبكات التي تجمع بيانات الحدود، وفي المقابل، تلقي عوائد اقتصادية.
إنه تطور لا مفر منه تقريبًا: إذا أصبحت البيانات نادرة وقيمة ويصعب إنتاجها، فسيكون لها سوق وسعر وطلب وعرض.
البلوكشين، مرة أخرى، هو الطبقة المثالية لـ:
لن يتقدم الذكاء الاصطناعي من خلال نماذج أكبر حجمًا، بل من خلال بيانات أكثر ثراءً، مصدرها العالم الحقيقي وتم جمعها عبر شبكات عالمية من المساهمين. إنها أكبر حمى ذهب في العقد القادم: ليست حمى الرقائق، بل حمى البيانات.
بروتوكولات Web3 ليست مجرد تفصيل: إنها المنصة الطبيعية لجمع والتحقق من وتوزيع وتعويض أولئك الذين يقدمون هذه البيانات. إذا كان الويب هو المادة الخام للموجة الأولى من الذكاء الاصطناعي، فإن العالم الحقيقي سيكون المادة الخام للموجة الثانية.
وهذه المرة، للمرة الأولى، لن يتم التحكم في الجمع من قبل عدد قليل من العمالقة، بل من قبل الشبكات.
شبكات مفتوحة ومحفزة ولامركزية: البنية التحتية الجديدة لبيانات الحدود.


