具身智能落地，开始补“感知”这一课

极客公园 20260507

具身智能落地，开始补“感知”这一课

随着2024年进入具身智能发展的关键阶段，人形机器人正从研发走向量产落地。行业普遍认为，今年将成为人形机器人产业化的元年。

在规模化铺开的同时，机器人所处的环境也在发生变化。从封闭的实验室结构化场景，逐渐转向开放、复杂的真实世界。

环境复杂度的提升，使得感知系统的重要性愈发突出。过去，感知层常被视为“可选模块”，如今却成为机器人执行闭环中的关键一环。感知一旦失效，后续的决策与动作将难以精准执行。

在最近举办的一场人形机器人半程马拉松中，户外长时间奔跑、光线变化、路面颠簸等挑战，使多个机器人的感知系统暴露出稳定性不足的问题。例如，有机器人在接近终点时因误判环境突然转向人群，引发广泛关注。

在开放场景中，感知系统不仅决定了机器人能否识别周围物体和空间结构，还直接影响其导航、避障、抓取等基本行为。

因此，感知系统正成为机器人落地过程中的关键瓶颈之一。过去低存在感的感知核心零部件，如今正被重新评估，其价值和作用日益凸显。

机器人感知能力的三层架构

当前，机器人感知能力主要可分为三类：

环境感知
本体状态感知
交互与操作感知

看见世界——环境感知传感器

环境感知是机器人进入真实场景的第一道门槛。它决定了机器人是否能理解空间结构、判断距离并完成导航与抓取。

在这一层面，核心硬件主要包括两类：

视觉传感器：包括RGB相机、双目相机、深度相机、鱼眼相机，提供图像、纹理及部分深度信息。
空间感知类传感器：以激光雷达为主，提供稳定的空间结构与距离信息。

然而，采集图像并不等于“看清”环境。在光照复杂、人流密集、室内外频繁切换等场景中，传统视觉系统容易失真。例如，逆光条件下目标区域模糊，强反光削弱边缘识别能力，夜间图像质量下降等问题，均会影响感知效果。

此外，动态场景下，目标物频繁移动，增加了识别和定位难度，视觉系统易出现目标丢失或距离误判。

手眼协同与算力挑战

环境感知还面临两个主要挑战：一是手眼协同要求高；二是算力与延迟压力大。

视觉与激光雷达在机器人执行动作时容易因肢体运动导致动态畸变、视角跳变或运动模糊，影响目标位置与深度测量。

在机械执行过程中，手、眼、物之间的相对位姿需达到亚厘米级的实时匹配，任何误差都可能导致抓取偏移、碰撞或跟踪丢失。

算力方面，视觉和激光雷达均产生大量数据，多传感器协同运行时，前端数据量庞大。而空间建模、目标识别、障碍物分割等算法复杂度高，对端侧计算能力提出更高要求。

同时，信息处理的延迟若达到数百毫秒，将导致路径判断偏差、反应迟缓，进而影响整体执行稳定性。

行业方向：深度感知与空间理解

为应对环境感知的挑战，行业正聚焦于两个方向：深度感知与空间理解。

深度感知：不仅识别目标，还能提供距离、轮廓与空间结构信息。
空间理解：在空间结构基础上，建立更完整的场景认知。

目前，行业主要采用两种解决方案：从二维图像向三维空间理解演进，以及从单一视觉向多传感器融合升级。

奥比中光的Gemini 330系列双目3D相机，采用自研深度引擎芯片MX6800，结合主动与被动成像技术，在光照复杂场景下仍能提供稳定三维数据。

禾赛科技的Kosmo产品集成了定制激光雷达、多摄像头与AIGC算法，将物理世界还原为数字三维模型。

速腾聚创的Active Camera则通过芯片级融合，实现深度、色彩和姿态的毫秒级同步，提升感知一致性与响应效率。

感知自己——本体状态感知传感器

除了环境感知，机器人还需具备“自我感知”能力，以维持动态平衡、控制动作力度。

本体状态感知主要依赖两类传感器：

惯性传感器（IMU），用于测量角速度与加速度，支撑姿态估计与动态平衡。
力矩与力传感器，包括六维力、足底力与关节力传感器，用于感知执行机构受力变化。

本体感知的难点主要体现在：

响应速度与稳定性要求高，避免动作控制滞后。
量产阶段对一致性与可靠性要求提升。
小型化与成本控制压力并存。

例如，特斯拉机器人的双脚配置的六维力传感器，单个成本可达6700美元，凸显了该类传感器的技术与成本门槛。

行业布局：导远科技与坤维科技

导远科技凭借其车规级IMU模组IMU5146，已与银河通用展开合作，提供高精度姿态测量与低延迟响应。

坤维科技则推出了专为人形机器人腕部与脚踝设计的HRS系列力传感器，重复精度达0.1%FS，已批量供货多家头部企业。

接触世界——交互与操作感知传感器

即使具备视觉与本体感知，机器人仍难以完成精细操作任务，如插拔接口、抓取易碎物等。

这类任务依赖于触觉传感器，其发展尚处于早期阶段，但未来可能成为机器人实现复杂操作的关键。

当前常见的触觉传感器包括电子皮肤、指尖传感器、阵列式压力传感器及视触觉传感器。它们分布在机器人手部、夹爪等位置，承担压力感知、材质识别及形变判断等任务。

触觉感知面临多重挑战：

产品标准化与数据复用性不足。
耐久性问题突出，长期接触与摩擦影响传感器寿命。
集成难度高，尤其在空间受限的末端执行器。
成本仍偏高，尚未实现大规模普及。

行业创新：帕西尼感知与戴盟机器人

帕西尼感知推出的PX-6AX-GEN3多维触觉传感器，具备六维力、材质识别与高耐久性，已在工业场景中广泛应用。

戴盟机器人则在触觉数据集建设方面取得突破，与多家机构合作推出Daimon-Infinity数据集，涵盖触觉、视觉、动作轨迹等多模态信息。

感知系统：机器人产业化的关键

总体来看，机器人感知能力的演进路径涉及三个层次：

视觉为主的环境感知，是进入真实场景的基础。
力觉为主的本体感知，是当前落地的瓶颈。
触觉感知是未来精细化操作的突破口。

无论是工业、仓储，还是家庭服务场景，人形机器人的落地均始于感知系统。感知数据的质量将直接影响后续决策与动作执行。

随着应用场景从实验室验证走向复杂开放环境，感知系统需要具备更高的稳定性、一致性与可量产性。

这一体系的成熟，或将决定机器人技术从“能动”走向“能干”的关键转折。

原文标题：具身智能落地，开始补“感知”这一课

查看全文

极客公园

作者最近更新

两大国资联合注资，海洋传感器企业江苏水声完成A轮千万融资

极客公园

16小时前
具身智能落地，开始补“感知”这一课

极客公园

14小时前
柯力传感机器人传感器迈入批量交付，2025年业绩稳步增长

极客公园

2天前

具身智能落地，开始补“感知”这一课