得场景者得具身智能:当数据成为物理AI的“矿权”,物联网的价值或将重构
得场景者得具身智能:当数据成为物理AI的“矿权”,物联网的价值或将重构
作者:彭昭(智次方创始人、云和资本联合创始合伙人)
物联网智库 原创
这是作者的第420篇专栏文章。
在上一篇文章《把大象塞进冰箱:“液态AI”背后藏着AIoT的第一性原理》中,作者将端侧智能比作一台冰箱,并提出两个关键约束:算力与能耗,以及数据与内容。文章重点探讨了如何通过液态AI实现“省电”(按需耗能),而本文则聚焦于更具挑战性的议题——“食材”从何而来。
在另一篇《当台积电把人形机器人写进财报:芯片侧的“明牌”与数据侧的“暗战”》中,作者曾指出,台积电在芯片端构建了三十年的护城河,大模型公司则在模型端迅速建立壁垒,而下一阶段的较量,很可能发生在数据端。本文将继续以“冰箱”为喻,深入剖析这场数据暗战的底层逻辑。
近期,国内出现了两个值得关注的场景。
一方面,京东宣布依托其零售与物流等真实业务场景,构建具身智能数据采集中心。公司计划动员数十万人佩戴自研设备JoyEgoCam,以第一人称视角记录日常活动,目标是在两年内积累一千万小时的交互数据。
另一方面,以优必选Walker S2为代表的工业人形机器人,已逐步进入新能源汽车制造、3C产线及物流仓储等场景,承担搬运、分拣与质检等任务。从比亚迪、富士康到顺丰,这一“进厂打工”的名单正在持续扩大。
一家电商巨头动员数十万人记录真实生活,一批机器人在工厂中边工作边积累数据。当前最具前瞻性的资本,正在以最基础的方式,获取一种无法通过市场购买的资源。
为何无法购买?因为互联网上的文字、图片和视频,本质上是人类对世界的“旁观记录”,而要在物理世界中行动的机器人,需要的是“第一人称”的多模态交互数据,包括推门时的阻力、关节角度、物理环境的实时反馈等。这类数据无法在“超市”中获取,只能通过亲自采集。
本文将围绕三个核心议题展开:具身智能数据为何存在根本性稀缺,存量物联网为何是解决这一问题的最佳数据源,以及在这条重塑的价值链中,谁将掌握主导权。
经验见底,而非数据
将行业瓶颈简单归结为“缺数据”,是一种误解。互联网上的数据几乎无限,真正稀缺的是“经验”。
这正是当前产业界的一个误区:将具身数据等同于视频数据。
文本大模型依赖的是“知识”,而具身大模型需要的是“经验”。真正的经验,必须包含在物理世界中试错并被纠正的过程。例如,要让机器人学会擦桌子,就必须在真实环境中,以高时间同步率记录视觉、力觉、关节位置与电机指令等多维传感轨迹。这类数据在互联网上并不存在。
这一区分,将问题从“数量不足”转变为“类型不符”,而类型上的差距,是资本难以弥补的。2025年,超过60亿美元的资本涌入人形机器人赛道,但核心瓶颈并未缓解。更多的资金可以带来顶级硬件和顶尖工程师,却无法创造出根本不存在的训练数据。
此前估算显示,文本大模型的训练语料以“百亿小时”计,而当前行业高质量的具身智能数据存量仅约50万小时。从50万到百亿,是两万倍的差距。更值得注意的是,全球正在运行的工业机器人数量已超过466万台(截至2024年),但可用于机器人学习的高质量真实交互数据,仍主要停留在百万级轨迹量级。以Open X-Embodiment为例,这一代表性开源数据集包含100万+真实机器人轨迹,已涵盖多种形态与任务,但相较于数百万台正在运行的机器人,其数据规模仍显不足。
更严峻的是,这一差距不仅体现在“量”上,更体现在“维度”上。
机器人的感知维度至少是六维以上的,包括视觉、听觉、力觉、触觉、本体感知等。然而,目前产业界九成的精力仍集中在RGB视觉等少数维度上。巨头们采集的所谓“机器人数据”,在感知维度上仅解决了十分之一的问题,其余如力觉、触觉、本体感知等,尚未形成规模化采集路径。
问题的症结,从来不在于数据“多不多”,而在于数据“对不对”。
既然“经验数据”只能由亲身作用于物理世界的实体来生成,那么当前,究竟什么东西已经大规模嵌入物理世界,并持续感知与动作?
答案,指向了一个长期被低估的领域:物联网。
油田与炼厂:物联网的价值或将重构
工业现场的传感器、街头的摄像头、腕上的可穿戴设备、道路上的智能汽车、产线上的机械臂……这些构成了庞大的“存量物联网”,是当前唯一一张已大规模部署于物理世界,并持续感知的网络。
过去我们关注数据采集,往往聚焦于专为采集而建的“数据工厂”与“训练场”;但实际上,还有一座更庞大、却未被当作数据资产看待的矿藏——那些早已为其他目的部署、仍在持续运行的存量设备。

这些设备,天生就是经验数据的采集通道。这意味着,物联网的价值定位可能需要重新评估:它应从过去以“连接与降本”为主导的“成本中心”,转变为为具身智能提供数据燃料的“利润中心”。
但在此前,我们必须回应一个质疑:既然工厂中早已布满传感器,为何机器人仍“吃不饱”?
答案是:绝大多数存量数据并不达标。它们彼此孤立、缺乏标注、模态不同步,更没有与动作指令形成配对。粗略统计,当前行业数据的“良品率”仅约三成。成本的大头并不在采集设备,而在于标注、验证与技能抽象化。谁能把良品率从三成提升至七成,谁就具备两到三倍的成本优势。
因此,油田虽多,炼厂仍稀缺。真正核心的,是那座能把“传感器废气”提炼为“可训练燃料”的炼厂。采集只是第一步,若不经过炼制,数据无法驱动任何智能。
有人可能会反驳:世界模型完全可以用仿真环境合成数据,物理采集不过是权宜之计。这条赛道的热度不容忽视,但从仿真到现实的鸿沟,本质上是物理规律的鸿沟,而非工程问题。
电网中一度电的微小电压波动、车间地面摩擦系数的细微差异、一块皮革表面的复杂纹理,都足以让仿真环境中表现完美的算法,在现实中瞬间失效。合成数据若要可信,必须依赖真实数据进行锚定与校准。因此,物联网采集的真实经验,永远不会被合成数据取代;相反,它将成为整个合成数据范式赖以成立的“物理底座”。
同时,我们必须承认,当前大量存量物联网设备采集的仍是温度、电流、振动等“低维遥测数据”,这并非机器人最需要的“高维接触数据”。真正能构成具身智能底座的,是正在快速部署的高保真、多模态边缘网络,包括高清摄像头、高精度可穿戴设备、车载多维传感系统,以及深度感知化的生产线。
而这,恰好与上一篇专栏内容互为表里:边缘端在提升能效的同时,也在增强感知能力。冰箱在变节能,而孕育智能的物理土壤,也在变得愈发肥沃。
价值链正在反转:得场景者,得具身智能
看清了“燃料”的来源,价值的落脚点也就清晰了。具身智能的资本金字塔可分为三层:最上层是机器人本体厂商,已进入红海;中间层是数据采集设备与平台,蓝海初现;最底层是数据要素基础设施,由国家队主导,越往下根系越深。
而这一金字塔的驱动逻辑,是数据飞轮:在真实世界部署设备,采集交互数据,训练并强化模型,进而推动更广泛、更深入的部署。

这一飞轮指向了一个反直觉的结论:它天然偏爱那些已经掌握物理场景的“存量玩家”,而非纯做本体的创业公司。
谁手中握有持续产生数据的真实场景,谁就掌握了先机;至于机器人本体是否精良,反而退居其次。就连老牌工业机器人厂商也坦言,其制造业客户群能直接接触真实工件与生产环境,这种“充满物理质感”的数据,正是纯软件出身的具身智能开发者所缺乏的。
数据飞轮的瓶颈,从来不在传感器,而在数据的确权、流通与标准化。而这,正被作为国家级工程强力推进。今年初,全国首单具身智能数据集已在江苏省数据交易所完成场内交易,实现了该品类在数交所交易的“零突破”;国家数据局也明确表示,今年将推出三十余项数据领域国家标准,并在智能体、具身智能等前沿方向提前布局。
未来,具身智能时代的胜负手,未必落在机器人外观或模型惊艳程度上,而是落在能否率先构建那套制度与工程底座,将庞大的物理世界真正转化为可交易的数据燃料。
写在最后
近期的两篇文章形成一个系列,上篇解决“按需耗能”,本文解决“持续供粮”。具身智能真正的护城河,既非本体,也非大脑,而是那片能自我造血的“物理底座”。当这些设备连成大网,数据与价值应如何交换?谁来制定规则?这是接下来需要回答的问题。
大象要真正走进物理世界,难题从来不止算力和能耗;数据、规则与价值分配,才是下一轮更硬的考题。
原文标题:得场景者得具身智能:当数据成为物理AI的“矿权”,物联网的价值必将重估
查看全文
作者最近更新
-
黄仁勋在COMPUTEX上展示的AI PC,背后隐藏着一个关键价值环节万能的大猪
06-06 13:11 -
聚焦泛半导体领域,又一国产高端传感器企业完成融资万能的大猪
06-06 14:31



评论0条评论