PhysX-Omni 构建统一物理 3D 生成体系,开启具身智能新纪元

传感梦工厂 20260531

  • 机器人
  • 人工智能

PhysX-Omni 构建统一物理 3D 生成体系,开启具身智能新纪元

物理 AI 的核心在于使机器具备“物理直觉”,这需要对现实世界的物理规律进行高精度建模。近日,大晓机器人与南洋理工大学联合推出的 PhysX-Omni,从技术体系上对物理 3D 生成进行了重构。

与传统的分类建模方式不同,研究团队聚焦“物理属性缺失”的根本问题,提出同步生成几何结构、绝对尺度、材料参数、运动学结构与交互可供性的创新方法。通过模板化 RLE 表征技术,在保留高分辨率几何细节的同时,完整编码了物体的全部物理信息。

这一突破使得“生成即可仿真”成为可能,为具身智能系统提供大量低成本、高质量的训练数据,显著提升了机器人学习系统的开发效率。

全球首个统一物理 3D 生成框架发布

PhysX-Omni 是首个统一物理 3D 生成框架,首次实现了刚体、可形变物体与关节物体的一体化建模。该框架能够同时输出绝对尺度、材料参数、运动学信息及交互属性,使 AI 生成的 3D 模型具备仿真就绪能力。

其核心技术在于面向视觉语言模型的模板化 RLE 几何表征。受二维游程编码启发,将 3D 资产体素化并按部件层级拆分,再沿 Z 轴生成二值掩码进行压缩编码。同时引入模板层机制,让相似结构切片共享基础模板,仅记录差异部分,从而在不损失几何精度的前提下大幅减少 token 数量,避免了分割误差。

PhysX-Omni 有效解决了传统 3D AIGC“重外观、轻物理”的痛点问题。此前大多数生成方法仅提供静态几何与视觉信息,无法还原真实物理行为,导致模型在仿真中频繁出现穿模、尺寸偏差、关节失效等问题,难以支持机器人交互训练。

构建首个通用仿真就绪物理 3D 数据集 PhysXVerse

PhysXVerse 是首个通用仿真就绪物理 3D 数据集,为物理 AI 与具身智能领域长期面临的数据稀缺问题提供了系统性解决方案。传统 3D 数据集多集中在几何与外观层面,缺乏关键物理属性标注,导致模型训练后无法直接应用于仿真。

该数据集基于 PartVerse 的部件分割结果,并通过人在环的方式进行精细物理标注,最终包含8.7K+高质量仿真就绪 3D 资产,覆盖2.9K+类别,涵盖室内家具、无人机、机器人、车辆及大型场景组件等多样化对象。

PhysXVerse 不仅保留了高精度几何与视觉信息,还完整标注了绝对尺度、材料参数、运动学结构与交互可供性等关键属性。这一数据集为物理 3D 生成模型的训练提供了标准化、高质量的基础,推动 3D 生成从“视觉可用”迈向“物理可用”。

首个物理 3D 生成基准评测集 PhysX-Bench 正式推出

PhysX-Bench 作为首个物理 3D 生成统一基准评测集,填补了行业在标准化评估体系上的空白。

该评测体系基于开源视觉语言模型 Qwen3.5 与物理仿真引擎构建,采用无真值评估模式,通过图像渲染与仿真视频完成模型性能评估,更贴近人类感知与实际应用场景需求。评测维度涵盖几何结构、绝对尺度、材料属性、交互可供性、运动学一致性与语义描述六大核心指标。

在实验设计上,通过自由落体、水中下落等物理实验间接验证材料参数,利用运动视频分析关节运动的合理性,确保评测结果的客观性与实用性。

PhysX-Bench 为不同物理 3D 生成方法提供了统一的横向对比平台,能够精准评估生成模型的物理真实性与仿真可用性,为物理 AI 与具身智能技术的持续演进提供了量化依据。

PhysX-Omni 显著超越现有方法,实现全面性能突破

研究人员将 PhysX-Omni 与 PhysXGen、Articulate-Anything、MonoArt 及 PhysX-Anything 等主流方法进行了系统比较,并在 PhysXVerse 与 PhysX-Mobility 数据集上进行了大量实验。

结果表明,PhysX-Omni 在几乎所有几何与物理属性指标上均取得最佳表现,展现出统一仿真就绪物理生成框架的优势。

特别是在绝对尺度评估中,PhysX-Omni 相较于 PhysXGen 与 PhysX-Anything 的误差降低了两个数量级,表明其对真实物理尺度的建模能力显著增强。在材料属性、交互可供性、语义描述及运动学结构等维度上,该模型也取得最优结果。

运动学性能的提升尤为突出,表明 PhysX-Omni 能更准确地推理关节结构与运动约束,生成具备真实物理行为的 articulated assets。

在 PhysX-Bench 的实际场景评估中,该模型在复杂类别与野外挑战样本中展现出更强的鲁棒性。实测结果表明,PhysX-Omni 生成的 3D 资产可直接导入主流物理模拟器,支撑如开关柜门、操作咖啡机等交互任务的学习与验证。其具备的场景级仿真生成能力为具身智能的大规模训练奠定了坚实基础。

构建具身智能世界的“基础设施”,推动通用物理建模发展

PhysX-Omni 实现了从文本描述到仿真就绪物理资产的端到端生成,为具身智能系统提供规模化、低成本的训练数据解决方案。

该模型能够批量生成具备真实物理属性的物体与机器人模型,无需人工标注或后续调试,有效降低训练数据的获取成本。其生成资产的物理参数高度贴近现实,显著提升了机器人策略在真实场景中的泛化能力。

除了单体物体生成,PhysX-Omni 还支持从 2D 图像或文本描述生成完整的仿真就绪场景。这一能力能够快速构建家居、工业、办公等多样交互环境,满足机器人导航、操作、协作等复杂任务的训练需求。

生成的 3D 资产可直接导入主流物理模拟器,支撑机器人完成开关柜门、操作咖啡机等交互任务的训练与验证,大幅缩短了具身智能系统从研发到落地的时间。

在训练环境与世界建模方面,研究团队进一步拓展了模型能力,结合现有方法实现场景级仿真就绪生成。通过 3D 布局与交互物体的协同构建,生成符合真实物理规则的完整室内外场景,为机器人导航、多智能体协作、复杂环境交互等高级任务提供多样化训练条件。

同时,该技术也为具身智能构建对物理世界的全局认知、迈向通用物理建模目标奠定了坚实基础。

查看全文

点赞

传感梦工厂

作者最近更新

  • 中国软件评测中心预测:养老服务机器人市场规模今年将突破百亿元
    传感梦工厂
    17小时前
  • Hugging Face 推出双足机器人:提供软硬件整套开发方案
    传感梦工厂
    17小时前
  • PhysX-Omni 构建统一物理 3D 生成体系,开启具身智能新纪元
    传感梦工厂
    19小时前

期刊订阅

相关推荐

  • 深圳机器人产业2017年产值超千亿元

    2018-12-05

  • 未来高端惯性传感器市场将借机器人和工业应用迎来新增长

    2018-12-07

  • 本田将在CES展出自动驾驶作业车和机器人新品

    2018-12-14

  • Velodyne推出针对自动驾驶中端应用的新型激光雷达

    2019-08-15

评论0条评论

    ×
    私信给传感梦工厂

    点击打开传感搜小程序 - 速览海量产品,精准对接供需

    • 收藏

    • 评论

    • 点赞

    • 分享

    收藏文章×

    已选择0个收藏夹

    新建收藏夹
    完成
    创建收藏夹 ×
    取消 保存

    1.点击右上角

    2.分享到“朋友圈”或“发送给好友”

    ×

    微信扫一扫,分享到朋友圈

    推荐使用浏览器内置分享功能

    ×

    关注微信订阅号

    关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
    广告