具身智能迈向产业化,感知层成为关键突破口
具身智能迈向产业化,感知层成为关键突破口

作者|向欣
2024 年被广泛认为是人形机器人实现量产落地的关键一年。
随着应用规模扩大,机器人所面临的环境也日益复杂——从实验室内的结构化空间,逐步转向更具挑战的开放场景。
在真实环境中,感知能力的短板开始显现。过去长期被忽视的感知层,如今已成为机器人实现可靠操作的关键。
机器人执行任务的核心闭环包括「感知—决策—动作」,其中感知作为第一环节,直接关系到后续控制和操作的准确性。
最近举行的人形机器人半程马拉松正是在户外复杂环境下进行,光照变化、地形起伏等问题,使多个参赛机器人的感知系统暴露出稳定性不足的问题。

接近终点时,部分机器人突然偏离赛道,跑入人群。
由此可见,在开放环境中,构建一套稳定且精准的感知系统是机器人实现可靠运行的基础。
感知层中那些原本低调的核心部件,正获得前所未有的关注。
从技术角度看,感知能力可以划分为三个层级:环境感知、本体状态感知以及交互与操作感知。

环境感知:机器人认知世界的窗口
环境感知是机器人进入真实场景的第一步。它决定了系统是否能识别目标、判断距离、理解空间关系,从而实现导航、避障及抓取定位。
这一层级主要依赖两类硬件:
- 视觉传感器:如 RGB 相机、双目相机、深度相机和鱼眼相机,用于获取图像、纹理和部分深度信息。
- 空间感知类传感器:如激光雷达,提供稳定的空间结构和距离信息。

奥比中光 Gemini 330 系列双目 3D 相机
然而,即使图像信息采集成功,也不代表系统能准确理解环境。
在动态人群、光照变化、室内外交替等场景中,RGB 相机容易出现失真,例如逆光导致目标区域变暗,强光造成边缘模糊,夜晚图像质量下降等。
此外,视觉系统在处理动态目标时,常面临目标丢失、距离判断偏差等问题。
环境感知的难点还包括:
- 手眼协同要求高:视觉与激光雷达在肢体运动中易产生畸变、跳变,导致瞬时误差。
- 算力与延迟压力大:多传感器数据融合、3D 建图、目标跟踪等算法复杂度高,对端侧处理能力提出更高要求。
一旦感知系统响应不及时,即便延迟仅数百毫秒,也可能导致路径判断失误、避障反应变慢或抓取位置不准。
因此,机器人要真正适应开放环境,环境感知层需从基础视觉采集升级为精准识别与空间理解。
目前行业聚焦于两个方向:增强深度感知能力与推动多传感器融合。
多家企业围绕此展开布局:
- 奥比中光以深度视觉为核心,其 Gemini 330 系列结合 MX6800 自研芯片,支持复杂光照下的稳定 3D 数据采集。
- 禾赛科技推出 Kosmo 空间智能 AI 硬件,融合激光雷达、摄像头与 AIGC 技术,实现物理世界的数字化还原。
- 速腾聚创则通过 Active Camera 将深度、色彩与姿态信息集成,实现毫秒级同步。


本体状态感知:机器人维持平衡的核心
除了对环境的感知,机器人还需了解自身状态,以实现动态中的稳定。
人形机器人是一个高度动态的系统,在行走、转身、上下坡或受到外部扰动时,都需要实时掌握姿态、速度与受力情况。
支撑这一层级的核心器件包括:
- 惯性测量单元(IMU):相当于机器人的“小脑”,用于姿态估计与动态平衡。
- 力矩与力传感器:包括关节扭矩传感器、六维力传感器等,用于监测关键部位的受力变化。

本体状态感知面临三项主要挑战:
- 响应速度与稳定性要求极高,任何感知延迟都可能影响控制精度。
- 量产阶段对一致性与可靠性提出更高标准。
- 小型化与成本控制压力并存,尤其在腕部或脚部安装高精度传感器。
在该领域,两类企业表现突出:
- 以导远科技为代表的车规级 IMU 厂商,其 IMU5146 模组具备 0.05° 姿态精度、1000Hz 输出频率,支持-40℃至 105℃宽温运行。
- 坤维科技与鑫精诚专注于高精度力传感器,例如坤维 HRS 系列已批量供货多家人形机器人头部企业。


交互与操作感知:精细动作的关键
具备视觉与本体感知后,机器人可完成基本移动与避障,但要执行复杂操作,如插拔接口或抓取柔软物体,还需触觉感知能力。
触觉传感器当前尚未成熟,但其发展将直接影响机器人在精细任务中的表现。
当前常见的触觉感知方案包括:
- 电子皮肤
- 指尖触觉传感器
- 阵列式压力传感器
- 视触觉传感器
这些传感器部署在手部、夹爪及末端执行器,执行接触检测、压力感知与材质判断等任务。
触觉感知仍面临以下挑战:
- 缺乏统一的标准与成熟产品,数据复用难度大。
- 传感器长期接触摩擦,对寿命与稳定性要求高。
- 集成难度大,需兼顾薄型化与灵敏度。
- 算法融合复杂,触觉信号与视觉、动作控制协同仍需探索。
多家企业正在推进触觉感知的技术突破:
- 帕西尼感知推出 PX-6AX-GEN3 多维触觉传感器,具备 1000 万次寿命与多参数输出。
- 他山科技研发 AI 触感芯片,支持三维力感知与材质识别。
- 戴盟机器人构建全球最大触觉数据集 Daimon-Infinity,涵盖触觉、视觉与动作信息。


感知能力的三个竞争焦点
从整体趋势看,机器人感知能力的竞争可划分为三个层次:
- 环境感知:视觉传感器是机器人进入真实世界的入口。
- 本体状态感知:决定机器人能否在动态中保持稳定与安全交互。
- 交互与操作感知:将决定机器人从“能动”走向“能干”的关键。
无论是工业、仓储、物流,还是家庭服务场景,感知能力的强弱直接决定机器人能否实现大规模部署。
感知链路的稳定性、可复制性与量产能力,将影响其进入真实场景的速度与效率。
当前,感知层的突破正成为人形机器人实现产业化进程的关键。
原文标题:具身智能落地,开始补“感知”这一课
查看全文
万能的大猪



评论0条评论