智元机器人真机强化学习技术正式进入工业产线验证阶段
智元机器人真机强化学习技术正式进入工业产线验证阶段
11月3日,智元创新(上海)科技有限公司(以下简称“智元机器人”)宣布,其研发的真机强化学习(Real-World Reinforcement Learning)技术已成功走出实验室,首次在工业产线中实现实际应用。目前,该技术已在与龙旗科技合作的验证产线中部署,相关可验证的实验数据将在后续进一步公开。
此次落地的真机强化学习方案,标志着AI驱动的智能控制技术在工业场景中迈出了关键一步。不同于传统的仿真环境训练,该技术允许AI算法直接在真实物理设备上进行强化学习(Reinforcement Learning),通过实际操作中的试错机制,使机器人自主学习最优行为策略。
尽管已有大量研究证实,强化学习在工业机器人领域具备巨大潜力,但如何将这些算法从仿真环境平滑过渡到真实工业环境,并实现规模化稳定部署,仍是行业亟待突破的技术难题。目前,大多数相关研究仍停留在实验层面,尚未广泛应用于实际产线。
智元机器人的这项真机强化学习技术,使得机器人在实际生产环境中具备自主学习与策略优化能力。新技能的学习与部署时间可压缩至数十分钟,且在整个运行过程中保持性能稳定。在生产线更换、产品换型或工艺流程调整时,该系统仅需极小的硬件改动与标准化部署流程,即可快速实现柔性生产。
智元机器人合伙人兼首席科学家罗剑岚在接受采访时指出,当前该技术已进入常态化运行阶段,其关键突破在于成功将AI模型部署至真实工厂环境中,实现100%任务完成率。通过系统联调机制,产线故障率已被控制在验收标准范围内。
罗剑岚表示,传统工业自动化设备在面对不确定环境时,往往难以兼顾精度、成功率与通用性。而真机强化学习技术正好弥补了这一短板,未来80%的应用将集中于集中上下料与柔性换线等高挑战性场景。
长期以来,精密制造领域面临着设备刚性瓶颈。传统机械臂通常依赖复杂的夹具设计与场地改造,不仅调试周期长,换型成本也较高;“视觉+力控”等柔性方案虽有所改善,但参数调整敏感、部署复杂,难以匹配消费电子行业高频次产品迭代的需求。
相较传统方法,真机强化学习技术展现出三大核心优势:快速部署、高度适配与柔性换型能力。该技术可在不同工位和产品线上实现快速迁移与复用,训练周期由“数周”级大幅缩短至“数十分钟”级,效率实现指数级提升。同时,系统具备自主适应来料位置偏差、尺寸公差等干扰因素的能力,在长时间运行中保持工业级别的稳定性。
尽管相较于仿真学习,真机强化学习在硬件与数据采集方面可能面临成本上升的问题,但在成本控制方面,该技术同样具备显著优势。罗剑岚指出,显性成本直接与产能挂钩,提升了整体生产效率;隐性成本方面,其高模块化与高柔性特性,使得在不同工序间切换时极为便捷,仅需极小的硬件调整。
罗剑岚强调,随着技术经验的积累,新产线的部署速度将进一步提升,整体成本也将逐步降低。他表示,这套技术具备良好的可管理性、可复制性与可扩展性,未来将作为通用模板进行推广,像“搭积木”一样,逐步从3C制造扩展至汽车、家电、医疗等多个工业领域。
查看全文
澎湃新闻



评论0条评论