За последнее десятилетие искусственный интеллект вырос, в основном питаясь одним и тем же ресурсом: общедоступными веб-данными. Тексты, изображения, документы, форумы, новости, блоги, репозитории... огромное количество материала, который модели поглотили для построения своих языковых и когнитивных способностей. Но эта фаза подходит к концу.
Согласно прогнозам, цитируемым Messari, общий объем общедоступного текста, доступного для обучения моделей — примерно 300 триллионов токенов — может быть полностью исчерпан между 2026 и 2032 годами. Это означает, что крупные модели "съели интернет", и теперь им нужно что-то еще. Следующим рубежом для ИИ будет уже не веб: это будет реальный мир.
И именно здесь в игру вступает концепция пограничных данных, ресурса, который определит конкурентоспособность будущих моделей. Видео, аудио, сенсорные, моторные, роботизированные данные, данные о действиях, данные, генерируемые при взаимодействии с физическим миром или сложными цифровыми интерфейсами. Данные, которые нельзя просто загрузить: их нужно собирать, координировать, проверять и, прежде всего, стимулировать.
По этой причине блокчейн — это не деталь или маргинальное дополнение: это инфраструктура, которая обеспечивает оркестровку этой новой экономики данных.
Самые продвинутые модели 2025 года — не только лингвистические, но и мультимодальные, агентные и ориентированные на рассуждения — больше не улучшаются простым добавлением общих текстовых наборов данных. Им требуется нечто гораздо более специфичное и гораздо более дорогое для сбора: данные, отражающие действия, намерения, движение, взаимодействие, манипуляцию, контекст.
Это относится, например, к агентам использования компьютера, ИИ, способным взаимодействовать с компьютером напрямую, как человек. Для обучения этих систем текстовых описаний недостаточно: нужны "траектории", которые представляют собой фактические записи людей, выполняющих задачи на экране.
Протокол вроде Chakra, упомянутый в отчете, разработал расширение, которое позволяет пользователям записывать свой экран во время выполнения повседневных задач: навигации по системе управления, подготовки документа Excel, редактирования изображений, использования профессионального программного обеспечения. Эти записи становятся бесценным материалом для обучения моделей, таких как GLADOS-1, первая модель использования компьютера, построенная почти полностью на краудсорсинговых данных.
И именно в этом суть: эти данные не существуют, пока кто-то их не произведет. И за них нужно платить. Так же, как платят за энергию или вывод.
Еще один яркий пример приходит из мира игр. Платформа вроде Shaga, родившаяся как децентрализованная сеть облачных игр, производит чрезвычайно ценный побочный продукт: так называемые Пары игрового процесса и действий (GAP), которые представляют собой синхронизированные пары того, что происходит на экране, и команд, которые выдает игрок.
Это данные, которые нельзя получить, просто просматривая видео на YouTube: их нужно захватывать у источника, на устройстве игрока. И этот тип набора данных, согласно оценкам, приведенным Messari, может стоить до 50–100 долларов за час игрового процесса.
Для контекста: Shaga уже накопила более 259 000 часов игрового процесса, с оценочной стоимостью более 26 миллионов долларов. И не случайно OpenAI годом ранее предложила полмиллиарда за приобретение Medal, аналогичной платформы, специализирующейся именно на записи игрового процесса.
Эти данные используются для обучения мировых моделей, моделей, которые не просто интерпретируют язык, но моделируют физику, причинно-следственные связи и взаимодействие агента с окружающей средой. Это модели, которые позволят создавать более интеллектуальных роботов, автономных агентов, продвинутые системы прогнозирования и ИИ, способный "перемещаться" в сложных средах.
И именно здесь мы подходим ко второй большой волне пограничных данных: роботизированным данным.
ИИ будущего будет находиться не только в центрах обработки данных. Он будет жить в роботах, дронах, автономных автомобилях, распределенных датчиках и устройствах умного дома. Каждому роботу понадобятся данные, чтобы научиться двигаться, идентифицировать объекты, принимать решения и манипулировать окружающей средой. И этот сбор данных невероятно дорог: он требует физического оборудования, операторов-людей для телеуправления, постоянного обслуживания и координации.
Проекты вроде PrismaX, BitRobot, GEODNET и NATIX начинают использовать стимулирующие механизмы, типичные для Web3, чтобы распределить эти затраты по глобальной сети участников. Вместо того, чтобы одна компания собирала роботизированные данные, тысячи пользователей могут делать это скоординированно, получая прямую компенсацию.
Это та же логика, что и при майнинге: но вместо вычислительной мощности здесь вкладом являются реальные данные.
Если роботы и ИИ-агенты действительно начнут взаимодействовать с физическим миром, потребуется совершенно новый уровень координации. Роботам нужно будет:
Именно здесь появляются такие инициативы, как OpenMind и Peaq, пытающиеся построить ончейн-инфраструктуру, посвященную коммуникации и идентичности роботов. Эквивалент DNS, но для машин. Система, где дроны, автономные автомобили, роботизированные руки или промышленные системы могут сигнализировать о своем присутствии, сертифицировать свои действия, платить другим системам и обмениваться услугами.
Это начало машинной экономики, экономики, населенной нечеловеческими сущностями, которые автономно взаимодействуют в децентрализованных сетях.
В отчете также значительное внимание уделяется IoTeX, протоколу, который в последние годы трансформировал свою инфраструктуру в комплексную платформу для сбора, сертификации и оркестровки данных реального мира.
IoTeX обеспечивает подключение датчиков, IoT-устройств, домашних систем и промышленного оборудования, предоставляя:
Сегодня IoTeX координирует более 16 000 устройств и десятки вертикальных проектов, предоставляя ИИ-агентам возможность доступа к проверенным данным из реального мира. Значительное отличие по сравнению с простым скрапингом.
По мнению Messari, траектория ясна: данные становятся финансовым активом во всех отношениях. Так же, как сегодня можно инвестировать в вычисления, GPU и колокацию, в будущем можно будет инвестировать в "потоки данных", приобретать права на использование, поддерживать сети, которые собирают пограничные данные, и в ответ получать экономическую отдачу.
Это почти неизбежная эволюция: если данные становятся редкими, ценными и трудными для производства, то у них будет рынок, цена, спрос и предложение.
Блокчейн, еще раз, является идеальным слоем для:
ИИ будет развиваться не через все более крупные модели, а через более богатые данные, полученные из реального мира и собранные через глобальные сети участников. Это величайшая золотая лихорадка следующего десятилетия: не чипов, а данных.
Протоколы Web3 — не просто деталь: они являются естественной платформой для сбора, проверки, распространения и компенсации тем, кто предоставляет эти данные. Если веб был сырьем первой волны ИИ, то реальный мир будет сырьем второй.
И на этот раз, впервые, сбор не будет контролироваться несколькими гигантами, а сетями.
Открытые, стимулированные, децентрализованные сети: новая инфраструктура пограничных данных.


