银河通用发布全球首例人形机器人实时网球对抗技术
银河通用发布全球首例人形机器人实时网球对抗技术
近日,由银河通用机器人团队发布的一段人形机器人与人类选手连续自主网球对打的视频引发广泛关注。视频展示的是其最新技术成果——面向网球对抗场景的实时智能规控算法LATENT。该算法实现了人形机器人在长程、高动态对抗场景中自主决策与复杂运动控制。
该成果一经发布便受到央视新闻等主流媒体的关注与报道,并在海外社交平台掀起热议。知名AI研究员Andrej Karpathy在观看视频后表示震惊,甚至一度怀疑其是否为AI生成内容。
实际上,视频呈现的是一场真实对抗:机器人与人类选手在网球场上进行了多回合连续对拉。真正令人瞩目的并非“机器人能打网球”这一表象,而是其不再依赖预编程指令,而是像人类一样进行全场跑动、自主决策和精准击球。
网球:人形机器人最具挑战的运动场景之一
网球因其高速、高对抗的特点,对人形机器人提出了极高要求:瞬时判断来球方向、全身协同控制回球质量、以及持续移动对耐力与控制力的考验。
视频中,机器人迅速调整站位,协调上下半身挥拍击球,并将球精准回击至指定区域。面对不同来球,它能灵活调整身体姿态与击球时机,与不同水平的对手完成持续对拉。
突破传统:LATENT算法的创新路径
LATENT(Learning Athletic Humanoid Tennis Skills from Imperfect Human Motion Data)是银河通用与清华大学联合提出的一项全新研究。该算法的核心目标是使机器人能够从不完美的人类动作数据中学习复杂运动技能,并在真实环境中完成高动态的网球对打。
传统方法通常依赖高质量遥操作数据进行模仿学习,但在网球这类场景中,这类数据难以获取。 LATENT则另辟蹊径,通过碎片化的人类动作数据,构建出一种“运动小脑”机制,实现机器人在高动态、高敏捷条件下的运动能力。
构建“运动技能空间”,提升动作控制能力
研究团队在隐空间中构建了一个“运动技能空间”,将碎片化动作组织为可泛化、可组合的技能结构。在训练过程中引入自由度扰动,使技能具备可修正与可探索特性。
这种设计让机器人不再局限于复制已有动作,而是在保留自然运动风格的同时具备细节优化能力。强化学习驱动下,规划器可在技能空间中进行实时组合与调整,从而实现更自然、更稳定的击球。
“隐空间动作屏障”:实现动作自然性与稳定性
为避免强化学习过程中出现“投机策略”,如抖动等非自然动作,研究团队引入了“隐空间动作屏障”(Latent Action Barrier, LAB)。
LAB为策略学习提供了一种有约束的探索机制,允许动作灵活调整,同时避免偏离人类自然运动模式。这一机制确保机器人在复杂环境中既能适应变化,又能保持动作流畅与稳定。
实验验证:精准、丝滑、覆盖全场
为验证LATENT性能,研究团队将算法部署至29自由度人形机器人,并在仿真与真实环境中开展测试。实验结果显示,机器人在多个指标上优于现有方法,包括击球成功率(SR)、回球落点精准性(DE)、关节顺滑程度(Smth)和关节力矩(Torque)。
在与人类选手进行的20局连续对打中,机器人在正手、反手、网前与底线击球中的成功率均超过80%。仿真中还引入了地面弹性、空气阻力等多种扰动因素,训练过程中借助GPU进行大规模强化学习。
统计数据显示,机器人在400轮回击中跑动覆盖全场,具备应对来自多方向的刁钻击球能力。此外,研究团队还展示了两台机器人之间的对练场景,为未来自主学习与能力进化提供了新思路。
迈向真实世界的具身智能
这一突破背后是银河通用已构建的全身全手端到端具身大模型“银河星脑”(AstraBrain)。人形机器人成功实现与人类的网球对抗,标志着其在人形机器人“大小脑”技术探索方面取得了关键进展。
网球作为高度浓缩的动态能力测试场,验证了机器人在复杂动态环境中实时感知、决策与全身协同控制的能力。这种能力是工业操作、零售服务、家庭助手等多场景任务的核心支撑。
从“打网球”到更广泛的场景应用,银河通用的这一成果不仅展现了人形机器人在高动态对抗中的潜力,也标志着行业正迈入一个全新的自主运动时代。
稿源:美通社
查看全文
电子创新网



评论0条评论