PhysX-Omni 推动 3D 物理建模进入新纪元
PhysX-Omni 推动 3D 物理建模进入新纪元
在构建具备物理直觉的 AI 系统中,精确模拟现实世界的物理行为是关键所在。大晓机器人携手南洋理工大学推出的 PhysX-Omni,革新了 3D 物理建模的技术框架。
研究团队摒弃了传统分类建模的路径,直面“物理属性缺失”的核心挑战,提出一种全新的建模范式,将物体的几何结构与其物理特征——包括材料特性、运动学结构、尺度信息及交互能力——同步生成,通过模板化 RLE 表征方式,既保持了高分辨率的细节,又完整编码了所有物理参数。
这项技术的突破使“生成即仿真”成为可能,为具身智能系统提供了大量低成本、高质量的训练数据,显著提升了机器人感知与决策系统的开发效率。
全球首个统一物理 3D 生成框架
PhysX-Omni 作为全球首个统一物理 3D 生成框架,实现了刚体、可变形物体与关节结构的一体化建模,能够同时输出绝对尺度、材料参数、运动学属性及交互特性等关键物理信息,使生成的模型具备真实的物理行为。
框架的核心创新在于引入了一种面向视觉语言模型的模板化 RLE 几何表示方式。受二维游程编码启发,研究者首先将 3D 模型体素化并按部件层级拆解,沿 Z 轴切分形成二维二值掩码进行紧凑编码;同时通过模板层设计,使结构相似的切片共享基础模板,仅记录差异信息。这不仅保留了精细的几何信息,还显著减少了数据量,并避免了分割误差。
这一方法彻底突破了传统 3D 生成系统“重外观、轻物理”的瓶颈。此前多数 3D 生成方法仅能输出静态几何与视觉效果,无法准确还原物体的物理行为,导致生成的模型在仿真环境中频繁出现穿模、比例失调或关节失真等问题,无法满足具身智能的训练需求。
构建首个通用仿真就绪物理 3D 数据集 PhysXVerse
PhysXVerse 是全球首个通用的仿真就绪物理 3D 数据集,为物理 AI 与具身智能领域解决了长期以来的高质量 3D 数据稀缺问题。
该数据集基于 PartVerse 的部件分割结果,结合人工标注流程构建,最终包含 8,700 个高质量 3D 资产,覆盖 2,900 个类别,涵盖室内家具、无人机、机器人、车辆及大型场景组件等多种复杂对象。
与现有 3D 数据集相比,PhysXVerse 不仅保留了高精度的几何和外观信息,更完整地标注了绝对尺度、材料属性、运动学结构与交互可供性等物理特征,为物理 3D 生成模型提供了标准化、高质量的训练数据基础,推动 3D 生成技术从“视觉可用”迈向“物理可用”的关键一步。
发布首个物理 3D 生成基准评测集 PhysX-Bench
PhysX-Bench 是首个面向物理 3D 生成的统一评测集,填补了该领域长期缺乏系统性评估体系的空白。
该评测集基于开源视觉语言模型与物理仿真引擎构建,采用无真值评估方式,通过渲染图像和仿真视频进行评估,更贴近人类感知与实际应用场景。它从几何结构、绝对尺度、材料参数、运动学一致性、交互可供性与语义描述六个维度构建全面评价体系,通过自由落体、水中下落等实验间接验证材料特性,通过运动视频分析关节行为的合理性。
PhysX-Bench 为不同 3D 生成方法提供了一个公平的对比平台,可精准量化生成资产的物理真实性与仿真可用性,为物理 AI 与具身智能的持续演进提供了统一的评估基准。
PhysX-Omni 实现性能全面领先
研究团队对 PhysX-Omni 与 PhysXGen、Articulate-Anything、MonoArt 和 PhysX-Anything 等最新物理就绪 3D 生成方法进行了全面比较,并在 PhysXVerse 和 PhysX-Mobility 数据集上进行了大量实验。结果显示,PhysX-Omni 在几乎所有的几何与物理属性指标上均表现最佳,充分体现了该框架在统一物理生成方面的技术优势。
PhysX-Omni 在物理参数预测方面实现显著提升。在绝对尺度评估中,其误差比 PhysXGen 和 PhysX-Anything 低两个数量级,表明模型对真实世界物理尺度的理解更加准确。在材料参数、交互可供性、语义描述和运动学一致性等维度上,PhysX-Omni 同样表现出色,尤其是在运动学方面,其对关节结构与运动约束的推理能力远超其他方法。
在 PhysX-Bench 的真实场景评估中,PhysX-Omni 在复杂类别和野外挑战中展现出更高的鲁棒性。实际验证表明,其生成的 3D 资产可直接部署到物理模拟器中,支持机器人执行开关柜门、操作咖啡机等交互任务,同时具备场景级物理生成能力,为具身智能的大规模训练提供了坚实基础。
打造具身智能的物理世界基础设施
PhysX-Omni 通过统一的物理 3D 生成技术,实现了从文本到可直接仿真的物理资产的端到端生成,为具身智能提供了高效、低成本的训练数据支持。
该框架可批量生成具备真实物理特性的物体和机器人模型,无需人工标注和二次调试,大幅降低了训练数据的获取成本。其生成的资产在物理参数上与现实世界高度一致,从而提升了机器人策略在真实环境中的泛化能力。
除了单体建模,PhysX-Omni 还支持从 2D 图像或文本描述生成完整的仿真场景,可快速构建家居、工业、办公等多样化交互环境,满足机器人导航、操作与协作等复杂任务的训练需求。
其生成的 3D 资产可直接导入主流物理模拟器,支撑机器人进行开关柜门、操作咖啡机等真实交互任务的训练与验证,极大缩短了从算法研发到实际部署的时间周期。
在训练环境和物理世界建模层面,团队进一步突破了单体建模的限制,结合其他方法实现了场景级仿真生成能力。通过结合 3D 布局与可交互对象,构建出符合真实物理规则的完整室内外环境,为机器人导航、多智能体协作和复杂环境交互等高阶任务提供了多样化的训练平台,也为具身智能系统实现对物理世界的全局认知和通用世界建模奠定了坚实基础。
查看全文
感知中国
传感器专家网
四方光电 


评论0条评论