浙江大学熊蓉教授发布《知行融贯发育SPIRE:机器人高精准泛化应用引擎》主题报告
浙江大学熊蓉教授发布《知行融贯发育SPIRE:机器人高精准泛化应用引擎》主题报告
2026年6月5日至6日,第十二届恰佩克奖活动在安徽芜湖顺利举行。来自机器人及相关产业链的专家学者、企业高管与行业代表齐聚一堂,围绕产业前沿趋势、核心技术突破与生态协同创新等议题展开深入交流,共同推动中国机器人产业迈向高质量与规模化发展。
6月5日上午,在高峰论坛的报告环节中,浙江大学熊蓉教授以《知行融贯发育SPIRE:机器人高精准泛化应用引擎》为主题,发表了精彩演讲。
以下为报告内容整理,由中国机器人网编辑发布:
当前,如何将传感信号高效转化为机器人行为智能,已成为具身智能研究的核心方向。随着机器人应用场景从工业制造逐步拓展至日常生活,面对形态多样、交互复杂的环境,传统依赖人工建模的方法已难以满足实际需求。
行业普遍认为,以“具身智能”为基础,通过学习驱动机器人行为进化,是实现广泛泛化应用的关键路径。调研显示,即便在自动化程度最高的汽车制造领域,仍存在大量依赖人工操作的环节。随着柔性混线生产模式的普及,产品种类日益丰富,传统固定程序机器人难以快速切换产线、适应多样化工件,调试过程高度依赖专家,导致应用成本居高不下。
在零部件与整车组装环节,机器人自动化率仍低于10%。诸如狭窄空间装配、柔性线缆形变控制、多工具协同作业等挑战,均无法通过传统建模方式解决。行业亟需具备自主学习与泛化能力的新一代机器人技术。
近年来,学术界与产业界围绕具身智能展开大量探索,技术范式不断演进。从依赖大模型与第一视角训练,到掌握运动、操作与环境移动等基础能力,再到语言-视觉-行为策略的端到端整合,以及近期兴起的视觉动作融合模型WAM,视觉与行为模型正逐步实现共生发展,为具身智能的落地提供了技术支撑。
然而,现有技术在产业化应用方面仍面临一定差距。工业场景对机器人提出了“高精准、高可靠、高效率、低成本”四大核心要求:部分工序精度需达到亚毫米级,甚至0.02毫米;运行必须稳定可靠,确保人机交互安全;作业效率需接近人类水平;同时,硬件与云端算力成本需得到有效控制。
当前主流模型仍存在诸多不足:语言视觉大模型在复杂场景中识别能力有限,二维视觉表征缺乏三维空间信息,难以预测行为可行性,也难以适应物理交互环境;模型仅能学习简单物理规律,面对复杂工况表现不佳;抓取力度、触感等非视觉行为信息无法通过视觉模型学习;此外,高质量训练数据的匮乏也严重制约了技术进步。
熊蓉教授自2000年起深耕智能机器人研究,2018年转向基于学习的行为智能技术研发,2024年牵头建设浙江人形机器人创新中心,专注于双臂、手部及全身协同作业技术。
为应对行业痛点,团队构建了完整的具身智能体系——知行融贯发育SPIRE机器人高精准泛化应用引擎,并提出一套特色技术方案。该体系以视觉、力觉、触觉等多源信息融合为核心,实现物理交互预测与行为智能协同,强调状态与行为的联合建模训练,并借鉴人类思维逻辑,构建“大脑+小脑”分工架构。
在数据层面,团队打通“真人数据采集—仿真环境训练—真机落地优化”全流程,最大化发挥各类数据的价值。通过低成本传感器采集人类作业数据,结合高保真场景重构与仿真平台,生成多样化训练数据。目前已完成近百个真实场景、上千类物体的数据采集,仿真平台支持全维度编辑与动态模拟。真机端实现头、臂、手、腰的全身协同一体化运算,求解时延低于10毫秒,运动跟踪精度小于1毫米。
依托海量数据开展分层训练,团队分别强化基础视觉认知模型与具身行为模型,并推动二者深度融合。基础模型重点提升机器人物体识别与空间关系理解能力,显著提升复杂空间约束与物件转运任务的作业成功率。同时,将语义信息深度融入感知模型,摆脱传统稠密信息依赖,综合成功率突破50%。
针对导航与操作两类场景,团队构建感知-动作联动视觉模型,用于预判人机、物物交互结果,支撑具身行为的精准执行。
在“大脑+小脑”协同架构中,二者分工明确、紧密配合。“大脑”负责环境认知与全局决策,适应开放、复杂、多变的场景,可自主生成行为序列。当作业受阻时,具备主动探索与自主纠错能力。目前,机器人在未知环境中的探索成功率已达94%。同时,团队构建具备记忆迭代与持续进化能力的智能体,可理解长指令,自主完成多环节连续任务,并具备目标自适应能力。
“小脑”则聚焦高精度执行,负责抓取、对准、装配等精细化动作。团队将传统专家控制模型与大模型学习相结合,有效解决传统控制算法参数调试繁琐的问题。目前,机器人可稳定抓取各类物件,插孔、对准作业精度可达0.03毫米,即使在动态人流环境中也能安全移动。针对柔性布料折叠、透明液体分液、杂乱工件分拣等高难度任务,均实现高稳定性作业,显著提升分拣成功率。
基于SPIRE引擎,团队研发出一体化机器人整机与配套工具链,末端执行精度最高可达0.02毫米,兼顾高精度、高实时性与高可靠性,同时降低应用开发门槛。
目前,该技术已在多个领域实现落地验证。在工业领域,已在头部车企完成料箱分拣、搬运、汽车前桥装配等全流程作业,装配精度达到亚毫米级;在3C行业实现柔性屏自动化上下料;在实验室场景中,完成透明液体自动分液与精密检测等工作。
在服务领域,2026年3月,团队与方太合作推出商用烹饪机器人,可独立完成倒油、添料、翻炒、出锅等全套烹饪动作。经过百次实操训练,机器人已熟练掌握打鸡蛋等备餐工序。
尽管机器人具身智能的发展已取得显著进展,但未来仍面临诸多挑战。熊蓉教授表示,期待与行业同仁及科研伙伴携手合作,共同推动机器人技术持续进步。
查看全文
玩物志



评论0条评论