达摩院发布开源具身智能基础模型RynnBrain，机器人具备时空记忆与推理能力

阿里巴巴达摩院于近日推出并开源了首个具身智能基础模型RynnBrain。该模型系列共包含7个版本，涵盖基础模型与后训练专用模型，其中最大规模的30B MoE架构模型成为行业首创。

RynnBrain的发布标志着机器人在时空记忆与空间推理能力方面取得突破性进展。在16项具身智能开源评测中，RynnBrain取得最优性能（SOTA），其表现优于谷歌Gemini Robotics ER 1.5等主流模型。这一进展显著提升了机器人的智能水平。

达摩院在RynnBrain中引入了两项核心能力：时空记忆与物理世界推理。其中，时空记忆使机器人能够在历史数据中追溯物体位置、目标区域，甚至预测其运动轨迹，从而实现对全局空间的回溯。

在推理方面，RynnBrain采用文本与空间定位交替进行的策略，使推理过程更贴近真实物理环境，有效降低了模型在处理复杂任务时可能出现的幻觉现象。

RynnBrain是在Qwen3-VL模型基础上进行训练的，结合自研RynnScale架构，训练效率相比常规方法提高了一倍。训练数据量超过2000万对，覆盖了环境感知、对象推理、第一人称视觉问答、空间推理及轨迹预测等多个关键任务。

实验结果显示，该模型在多个评估指标上均表现优异，超越了当前行业内的多个顶尖模型，包括英伟达的Cosmos Reason 2。

作为一款具备良好扩展性的基础模型，RynnBrain可被快速微调用于导航、路径规划与动作执行等任务。例如，仅需数百条数据，即可训练出性能超越Gemini 3 Pro的具身规划模型。

此次发布的RynnBrain系列模型包含了完整的推理与训练代码，涵盖全尺寸基础模型和后训练专用模型。其中，首个30B MoE架构模型在仅使用3B推理参数的情况下，即可达到甚至超越72B模型的性能。

此外，达摩院同步开源了全新评测基准RynnBrain-Bench，专注于评估时空细粒度任务，填补了当前行业中相关领域的空白。

达摩院具身智能实验室负责人赵德丽表示：“RynnBrain实现了对物理世界的深度理解与可靠规划，是迈向通用具身智能的关键一步。我们期待它推动人工智能从数字世界迈向真实物理场景的加速落地。”

查看全文

作者最近更新