得场景者得具身智能：当数据成为物理AI的“矿权”，物联网的价值或将重构

万能的大猪 20260610

得场景者得具身智能：当数据成为物理AI的“矿权”，物联网的价值或将重构

作者：彭昭（智次方创始人、云和资本联合创始合伙人）

物联网智库原创

这是作者的第420篇专栏文章。

在上一篇文章《把大象塞进冰箱：“液态AI”背后藏着AIoT的第一性原理》中，作者将端侧智能比作一台冰箱，并提出两个关键约束：算力与能耗，以及数据与内容。文章重点探讨了如何通过液态AI实现“省电”（按需耗能），而本文则聚焦于更具挑战性的议题——“食材”从何而来。

在另一篇《当台积电把人形机器人写进财报：芯片侧的“明牌”与数据侧的“暗战”》中，作者曾指出，台积电在芯片端构建了三十年的护城河，大模型公司则在模型端迅速建立壁垒，而下一阶段的较量，很可能发生在数据端。本文将继续以“冰箱”为喻，深入剖析这场数据暗战的底层逻辑。

近期，国内出现了两个值得关注的场景。

一方面，京东宣布依托其零售与物流等真实业务场景，构建具身智能数据采集中心。公司计划动员数十万人佩戴自研设备JoyEgoCam，以第一人称视角记录日常活动，目标是在两年内积累一千万小时的交互数据。

另一方面，以优必选Walker S2为代表的工业人形机器人，已逐步进入新能源汽车制造、3C产线及物流仓储等场景，承担搬运、分拣与质检等任务。从比亚迪、富士康到顺丰，这一“进厂打工”的名单正在持续扩大。

一家电商巨头动员数十万人记录真实生活，一批机器人在工厂中边工作边积累数据。当前最具前瞻性的资本，正在以最基础的方式，获取一种无法通过市场购买的资源。

为何无法购买？因为互联网上的文字、图片和视频，本质上是人类对世界的“旁观记录”，而要在物理世界中行动的机器人，需要的是“第一人称”的多模态交互数据，包括推门时的阻力、关节角度、物理环境的实时反馈等。这类数据无法在“超市”中获取，只能通过亲自采集。

本文将围绕三个核心议题展开：具身智能数据为何存在根本性稀缺，存量物联网为何是解决这一问题的最佳数据源，以及在这条重塑的价值链中，谁将掌握主导权。

经验见底，而非数据

将行业瓶颈简单归结为“缺数据”，是一种误解。互联网上的数据几乎无限，真正稀缺的是“经验”。

这正是当前产业界的一个误区：将具身数据等同于视频数据。

文本大模型依赖的是“知识”，而具身大模型需要的是“经验”。真正的经验，必须包含在物理世界中试错并被纠正的过程。例如，要让机器人学会擦桌子，就必须在真实环境中，以高时间同步率记录视觉、力觉、关节位置与电机指令等多维传感轨迹。这类数据在互联网上并不存在。

这一区分，将问题从“数量不足”转变为“类型不符”，而类型上的差距，是资本难以弥补的。2025年，超过60亿美元的资本涌入人形机器人赛道，但核心瓶颈并未缓解。更多的资金可以带来顶级硬件和顶尖工程师，却无法创造出根本不存在的训练数据。

此前估算显示，文本大模型的训练语料以“百亿小时”计，而当前行业高质量的具身智能数据存量仅约50万小时。从50万到百亿，是两万倍的差距。更值得注意的是，全球正在运行的工业机器人数量已超过466万台（截至2024年），但可用于机器人学习的高质量真实交互数据，仍主要停留在百万级轨迹量级。以Open X-Embodiment为例，这一代表性开源数据集包含100万+真实机器人轨迹，已涵盖多种形态与任务，但相较于数百万台正在运行的机器人，其数据规模仍显不足。

更严峻的是，这一差距不仅体现在“量”上，更体现在“维度”上。

机器人的感知维度至少是六维以上的，包括视觉、听觉、力觉、触觉、本体感知等。然而，目前产业界九成的精力仍集中在RGB视觉等少数维度上。巨头们采集的所谓“机器人数据”，在感知维度上仅解决了十分之一的问题，其余如力觉、触觉、本体感知等，尚未形成规模化采集路径。

问题的症结，从来不在于数据“多不多”，而在于数据“对不对”。

既然“经验数据”只能由亲身作用于物理世界的实体来生成，那么当前，究竟什么东西已经大规模嵌入物理世界，并持续感知与动作？

答案，指向了一个长期被低估的领域：物联网。

油田与炼厂：物联网的价值或将重构

工业现场的传感器、街头的摄像头、腕上的可穿戴设备、道路上的智能汽车、产线上的机械臂……这些构成了庞大的“存量物联网”，是当前唯一一张已大规模部署于物理世界，并持续感知的网络。

过去我们关注数据采集，往往聚焦于专为采集而建的“数据工厂”与“训练场”；但实际上，还有一座更庞大、却未被当作数据资产看待的矿藏——那些早已为其他目的部署、仍在持续运行的存量设备。

这些设备，天生就是经验数据的采集通道。这意味着，物联网的价值定位可能需要重新评估：它应从过去以“连接与降本”为主导的“成本中心”，转变为为具身智能提供数据燃料的“利润中心”。

但在此前，我们必须回应一个质疑：既然工厂中早已布满传感器，为何机器人仍“吃不饱”？

答案是：绝大多数存量数据并不达标。它们彼此孤立、缺乏标注、模态不同步，更没有与动作指令形成配对。粗略统计，当前行业数据的“良品率”仅约三成。成本的大头并不在采集设备，而在于标注、验证与技能抽象化。谁能把良品率从三成提升至七成，谁就具备两到三倍的成本优势。

因此，油田虽多，炼厂仍稀缺。真正核心的，是那座能把“传感器废气”提炼为“可训练燃料”的炼厂。采集只是第一步，若不经过炼制，数据无法驱动任何智能。

有人可能会反驳：世界模型完全可以用仿真环境合成数据，物理采集不过是权宜之计。这条赛道的热度不容忽视，但从仿真到现实的鸿沟，本质上是物理规律的鸿沟，而非工程问题。

电网中一度电的微小电压波动、车间地面摩擦系数的细微差异、一块皮革表面的复杂纹理，都足以让仿真环境中表现完美的算法，在现实中瞬间失效。合成数据若要可信，必须依赖真实数据进行锚定与校准。因此，物联网采集的真实经验，永远不会被合成数据取代；相反，它将成为整个合成数据范式赖以成立的“物理底座”。

同时，我们必须承认，当前大量存量物联网设备采集的仍是温度、电流、振动等“低维遥测数据”，这并非机器人最需要的“高维接触数据”。真正能构成具身智能底座的，是正在快速部署的高保真、多模态边缘网络，包括高清摄像头、高精度可穿戴设备、车载多维传感系统，以及深度感知化的生产线。

而这，恰好与上一篇专栏内容互为表里：边缘端在提升能效的同时，也在增强感知能力。冰箱在变节能，而孕育智能的物理土壤，也在变得愈发肥沃。

价值链正在反转：得场景者，得具身智能

看清了“燃料”的来源，价值的落脚点也就清晰了。具身智能的资本金字塔可分为三层：最上层是机器人本体厂商，已进入红海；中间层是数据采集设备与平台，蓝海初现；最底层是数据要素基础设施，由国家队主导，越往下根系越深。

而这一金字塔的驱动逻辑，是数据飞轮：在真实世界部署设备，采集交互数据，训练并强化模型，进而推动更广泛、更深入的部署。

这一飞轮指向了一个反直觉的结论：它天然偏爱那些已经掌握物理场景的“存量玩家”，而非纯做本体的创业公司。

谁手中握有持续产生数据的真实场景，谁就掌握了先机；至于机器人本体是否精良，反而退居其次。就连老牌工业机器人厂商也坦言，其制造业客户群能直接接触真实工件与生产环境，这种“充满物理质感”的数据，正是纯软件出身的具身智能开发者所缺乏的。

数据飞轮的瓶颈，从来不在传感器，而在数据的确权、流通与标准化。而这，正被作为国家级工程强力推进。今年初，全国首单具身智能数据集已在江苏省数据交易所完成场内交易，实现了该品类在数交所交易的“零突破”；国家数据局也明确表示，今年将推出三十余项数据领域国家标准，并在智能体、具身智能等前沿方向提前布局。

未来，具身智能时代的胜负手，未必落在机器人外观或模型惊艳程度上，而是落在能否率先构建那套制度与工程底座，将庞大的物理世界真正转化为可交易的数据燃料。

写在最后

近期的两篇文章形成一个系列，上篇解决“按需耗能”，本文解决“持续供粮”。具身智能真正的护城河，既非本体，也非大脑，而是那片能自我造血的“物理底座”。当这些设备连成大网，数据与价值应如何交换？谁来制定规则？这是接下来需要回答的问题。

大象要真正走进物理世界，难题从来不止算力和能耗；数据、规则与价值分配，才是下一轮更硬的考题。

原文标题：得场景者得具身智能：当数据成为物理AI的“矿权”，物联网的价值必将重估

查看全文

万能的大猪

作者最近更新

得场景者得具身智能：当数据成为物理AI的“矿权”，物联网的价值或将重构