大晓机器人联合高校发布全球首个全屋三维可交互世界模型 Kairos-HomeWorld,开源全球最大中国家庭专属全屋3D数据集
大晓机器人联合高校发布全球首个全屋三维可交互世界模型 Kairos-HomeWorld,开源全球最大中国家庭专属全屋3D数据集
6月5日,大晓机器人携手香港中文大学多媒体实验室与深圳河套学院,联合发布最新研究成果——Kairos-HomeWorld。该模型是全球首个实现全屋三维生成与物体级可交互的世界模型统一框架,标志着室内场景生成技术迈入新阶段。
当前,室内场景生成技术多局限于单房间建模,缺乏全局一致性与可操作性。Kairos-HomeWorld通过创新的四阶段分层生成架构,实现了从文本指令到结构连贯、物理合理、功能完整的全屋三维场景的端到端生成,为具身人工智能与家庭服务机器人训练提供了高保真、大规模的中国家庭场景实训平台。
为支撑具身智能技术的本土化落地,研究团队同步开源了全球规模最大的中国家庭专属全屋3D数据集。该数据集包含30万张真实住宅平面图与5000个完整带可交互家具和物体的仿真场景,覆盖多种典型户型,全面还原中国家庭居住特征。
此前,北美机器人企业Figure AI与房地产巨头Brookfield达成合作,利用其超10万套住宅单元进行机器人训练。Kairos-HomeWorld的发布,为本土机器人训练提供了更具成本效益与扩展性的解决方案。
相比传统实地采集方式,Kairos-HomeWorld依托模型批量生成多样化仿真场景,自带物理交互属性,机器人可在虚拟环境中完成各类家务训练。新增场景边际成本接近于零,大幅节省场地运维与家具损耗开支,同时突破现实房源数量限制,显著提升训练效率。
目前,Kairos-HomeWorld已应用于大晓机器人的具身智能训练,支持跨房间导航、多房间物品整理等复杂任务的全流程仿真,有效缩短虚拟到现实的迁移周期,降低研发门槛,推动机器人在中国市场的普及。
首创全屋三维生成与物体级可交互 打破行业仿真数据天花板
Kairos-HomeWorld采用四阶段分层生成架构(全局结构—局部细节—闭环校验—交互增强),首次实现从单句文本到结构全局一致、物理合规、物体可交互的完整住宅三维场景生成,重构了室内场景生成的技术范式。
该架构将全屋生成任务解耦为四个阶段,有效解决传统方法在全局一致性、物理错误与场景不可交互方面的难题。
第一阶段引入基于K-D树的平面图结构化表示方法,将真实住宅平面图转化为大语言模型可高效学习的分层文本结构,避免房间重叠与拓扑断裂问题。第二阶段采用“俯视图全局初始化+第一人称细节漫游”策略,以3D建筑外壳为锚点,解决2D-3D提升方法中的几何漂移问题。
第三阶段通过微调视觉语言模型构建递归闭环校验机制,自动检测并修正“沙发挡门”、“物体穿墙”等物理违规,将家具布局碰撞率控制在行业最优水平。
第四阶段实现表面中心物体放置算法,系统自动获取物体材质、密度、铰接结构等属性。生成的每个场景平均包含超过15个可操作物体,足迹物体密度达4.16,所有物体均可直接导入仿真引擎进行抓取、移动、堆叠等交互操作。
该框架精准解决房间动线混乱、功能邻接性缺失等全局一致性问题,打破“只能看不能用”的局限,使虚拟环境具备支撑机器人导航、操作与任务执行的能力,同时破解3D仿真数据稀缺瓶颈,解决合成数据不真实、扫描数据不可交互的矛盾。
30万真实户型+5000家庭全场景,全球首个中国家庭专属全屋3D数据集发布
大晓机器人联合香港中文大学多媒体实验室发布首个专为中国家庭居住场景打造的全屋3D数据集,数据规模全球最大。该数据集包含30万张结构化标注的真实住宅平面图、5000个完整室内布局与家具布置的全屋仿真场景,以及5万个支持物理仿真与交互操作的物体资产。
30万张真实住宅平面图全部来自中国市场,经过多阶段自动化处理流程完成矢量化与结构化标注,涵盖门窗位置、房间几何、功能分区、连通关系等信息,是目前全球最大的真实住宅平面图数据集。
基于该数据集生成的全屋仿真场景,每户均包含完整家具布局,并借助Physx-Omni模型自动生成平均15+个带物理属性的可交互对象,支持直接导入仿真引擎进行交互式训练。
(全球室内场景资源对比表,其中各符号与术语的含义如下:Rec. 代表基于重建的真实世界数据集;S./H. 分别指代带家具场景数与住宅数;Sim-ready 即仿真就绪度,用于衡量数据集是否提供可直接在仿真/渲染引擎中实例化、并支持物体级交互操作的完整3D场景;MObj. 表示有数据可查时的单场景平均可操作物体数量;n/r 指未报告相关数据,“–” 表示该项不适用;Collection 则代表由多个不同数据源整合而成的聚合类数据集。)
更具行业价值的是其中国家庭专属属性。此前主流开源室内场景数据集多基于欧美居住习惯构建,存在房间布局欧美化、开放式厨房、缺乏阳台功能区等问题,导致机器人在进入中国家庭时出现“水土不服”。
Kairos-HomeWorld数据集覆盖全国不同城市、不同面积段的典型户型,从30㎡一居室到200㎡以上改善型大户型,完整还原中国家庭特有的南北通透布局、封闭式厨房、独立生活阳台、干湿分离卫生间、玄关鞋柜等本土居住特征,甚至包含老小区非矩形厨房、不规则客厅等复杂户型。
该数据集将面向学术界与产业界全面开源,团队计划在后续版本中持续扩充不同地域、不同装修风格的场景样本,并加入更多中国家庭特有的物品与交互场景,进一步降低具身AI的本土化训练门槛,加速服务机器人在中国家庭的规模化落地。
沉浸式演示一键生成中国家庭仿真场景,加速机器人训练
Kairos-HomeWorld已成功应用于大晓机器人的具身智能训练。演示视频完整呈现了从文本指令到可交互户型的全链路生成过程,直观展示其“一键生成、全局一致、物理合规”的核心能力。
在视频中,输入“生成一套新中式90平米两室一厅”的文本提示后,模型基于中国真实户型数据与K-D树结构化表示,快速生成符合本土居住习惯的空房间结构,精准还原南北通透、功能分区合理的典型户型。
随后通过“俯视图全局布局 + 第一人称细节填充”的分层策略,自动生成风格统一的家具摆放;接着通过Physx-Omni模型为桌面、台面等表面生成带完整物理属性的可交互物品资产,例如铰接属性、密度、流形等。
通过自然语言下达“全屋物品整理”的复杂指令,机器人自动将其拆解为多个精准的子任务,按照“客厅→阳台→厨房→主卧→餐厅→次卧”的完整全屋动线依次执行。
在大规模中国家庭仿真环境训练的机器人可以识别不同物品、规划最优路径、完成精准抓取与放置的全过程,包括打开冰箱和柜门的铰接物体交互、倒洗衣液的流体交互、拉开窗帘的柔性物体交互、拿苹果的不规则物体交互,以及放置零食的模拟重力属性交互等。
相比传统仅能支持导航训练的仿真环境,Kairos-HomeWorld生成的场景具备全局一致的空间结构,支持机器人跨房间连续导航;所有物体均带有真实物理属性,机器人可与超过15种不同类型的物品进行自然交互,模拟真实世界的碰撞、重力与摩擦效果,让机器人在虚拟世界中就能完成复杂家务任务的全流程训练,大幅缩短从仿真到现实的迁移周期。
查看全文
玩物志



评论0条评论