具身智能落地,开始补“感知”这一课
具身智能落地,开始补“感知”这一课
随着2024年进入具身智能发展的关键阶段,人形机器人正从研发走向量产落地。行业普遍认为,今年将成为人形机器人产业化的元年。
在规模化铺开的同时,机器人所处的环境也在发生变化。从封闭的实验室结构化场景,逐渐转向开放、复杂的真实世界。
环境复杂度的提升,使得感知系统的重要性愈发突出。过去,感知层常被视为“可选模块”,如今却成为机器人执行闭环中的关键一环。感知一旦失效,后续的决策与动作将难以精准执行。
在最近举办的一场人形机器人半程马拉松中,户外长时间奔跑、光线变化、路面颠簸等挑战,使多个机器人的感知系统暴露出稳定性不足的问题。例如,有机器人在接近终点时因误判环境突然转向人群,引发广泛关注。
在开放场景中,感知系统不仅决定了机器人能否识别周围物体和空间结构,还直接影响其导航、避障、抓取等基本行为。
因此,感知系统正成为机器人落地过程中的关键瓶颈之一。过去低存在感的感知核心零部件,如今正被重新评估,其价值和作用日益凸显。
机器人感知能力的三层架构
当前,机器人感知能力主要可分为三类:
- 环境感知
- 本体状态感知
- 交互与操作感知
看见世界——环境感知传感器
环境感知是机器人进入真实场景的第一道门槛。它决定了机器人是否能理解空间结构、判断距离并完成导航与抓取。
在这一层面,核心硬件主要包括两类:
- 视觉传感器:包括RGB相机、双目相机、深度相机、鱼眼相机,提供图像、纹理及部分深度信息。
- 空间感知类传感器:以激光雷达为主,提供稳定的空间结构与距离信息。
然而,采集图像并不等于“看清”环境。在光照复杂、人流密集、室内外频繁切换等场景中,传统视觉系统容易失真。例如,逆光条件下目标区域模糊,强反光削弱边缘识别能力,夜间图像质量下降等问题,均会影响感知效果。
此外,动态场景下,目标物频繁移动,增加了识别和定位难度,视觉系统易出现目标丢失或距离误判。
手眼协同与算力挑战
环境感知还面临两个主要挑战:一是手眼协同要求高;二是算力与延迟压力大。
视觉与激光雷达在机器人执行动作时容易因肢体运动导致动态畸变、视角跳变或运动模糊,影响目标位置与深度测量。
在机械执行过程中,手、眼、物之间的相对位姿需达到亚厘米级的实时匹配,任何误差都可能导致抓取偏移、碰撞或跟踪丢失。
算力方面,视觉和激光雷达均产生大量数据,多传感器协同运行时,前端数据量庞大。而空间建模、目标识别、障碍物分割等算法复杂度高,对端侧计算能力提出更高要求。
同时,信息处理的延迟若达到数百毫秒,将导致路径判断偏差、反应迟缓,进而影响整体执行稳定性。
行业方向:深度感知与空间理解
为应对环境感知的挑战,行业正聚焦于两个方向:深度感知与空间理解。
- 深度感知:不仅识别目标,还能提供距离、轮廓与空间结构信息。
- 空间理解:在空间结构基础上,建立更完整的场景认知。
目前,行业主要采用两种解决方案:从二维图像向三维空间理解演进,以及从单一视觉向多传感器融合升级。
奥比中光的Gemini 330系列双目3D相机,采用自研深度引擎芯片MX6800,结合主动与被动成像技术,在光照复杂场景下仍能提供稳定三维数据。
禾赛科技的Kosmo产品集成了定制激光雷达、多摄像头与AIGC算法,将物理世界还原为数字三维模型。
速腾聚创的Active Camera则通过芯片级融合,实现深度、色彩和姿态的毫秒级同步,提升感知一致性与响应效率。
感知自己——本体状态感知传感器
除了环境感知,机器人还需具备“自我感知”能力,以维持动态平衡、控制动作力度。
本体状态感知主要依赖两类传感器:
- 惯性传感器(IMU),用于测量角速度与加速度,支撑姿态估计与动态平衡。
- 力矩与力传感器,包括六维力、足底力与关节力传感器,用于感知执行机构受力变化。
本体感知的难点主要体现在:
- 响应速度与稳定性要求高,避免动作控制滞后。
- 量产阶段对一致性与可靠性要求提升。
- 小型化与成本控制压力并存。
例如,特斯拉机器人的双脚配置的六维力传感器,单个成本可达6700美元,凸显了该类传感器的技术与成本门槛。
行业布局:导远科技与坤维科技
导远科技凭借其车规级IMU模组IMU5146,已与银河通用展开合作,提供高精度姿态测量与低延迟响应。
坤维科技则推出了专为人形机器人腕部与脚踝设计的HRS系列力传感器,重复精度达0.1%FS,已批量供货多家头部企业。
接触世界——交互与操作感知传感器
即使具备视觉与本体感知,机器人仍难以完成精细操作任务,如插拔接口、抓取易碎物等。
这类任务依赖于触觉传感器,其发展尚处于早期阶段,但未来可能成为机器人实现复杂操作的关键。
当前常见的触觉传感器包括电子皮肤、指尖传感器、阵列式压力传感器及视触觉传感器。它们分布在机器人手部、夹爪等位置,承担压力感知、材质识别及形变判断等任务。
触觉感知面临多重挑战:
- 产品标准化与数据复用性不足。
- 耐久性问题突出,长期接触与摩擦影响传感器寿命。
- 集成难度高,尤其在空间受限的末端执行器。
- 成本仍偏高,尚未实现大规模普及。
行业创新:帕西尼感知与戴盟机器人
帕西尼感知推出的PX-6AX-GEN3多维触觉传感器,具备六维力、材质识别与高耐久性,已在工业场景中广泛应用。
戴盟机器人则在触觉数据集建设方面取得突破,与多家机构合作推出Daimon-Infinity数据集,涵盖触觉、视觉、动作轨迹等多模态信息。
感知系统:机器人产业化的关键
总体来看,机器人感知能力的演进路径涉及三个层次:
- 视觉为主的环境感知,是进入真实场景的基础。
- 力觉为主的本体感知,是当前落地的瓶颈。
- 触觉感知是未来精细化操作的突破口。
无论是工业、仓储,还是家庭服务场景,人形机器人的落地均始于感知系统。感知数据的质量将直接影响后续决策与动作执行。
随着应用场景从实验室验证走向复杂开放环境,感知系统需要具备更高的稳定性、一致性与可量产性。
这一体系的成熟,或将决定机器人技术从“能动”走向“能干”的关键转折。
原文标题:具身智能落地,开始补“感知”这一课
查看全文
极客公园
传感器专家网
四方光电 


评论0条评论