设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

首个机器人 4D 世界模型来了:智元机器人团队提出 EnerVerse 架构

2025/1/8 10:07:43 来源:IT之家 作者:归泷(实习) 责编:归泷
感谢IT之家网友 Skyraver 的线索投递!

IT之家 1 月 8 日消息,如何让机器人在任务指引和实时观测的基础上规划未来动作是具身智能领域核心问题,其受“模态对齐”和“数据稀缺”制约。智元机器人团队提出 EnerVerse 架构,通过自回归扩散模型(autoregressive diffusion),在生成未来具身空间的同时引导机器人完成复杂任务。

据介绍,不同于现有方法简单应用视频生成模型,EnerVerse 深度结合具身任务需求,创新性地引入稀疏记忆机制(Sparse Memory)与自由锚定视角(Free Anchor View, FAV),在提升 4D 生成能力的同时,实现了动作规划性能的突破。

智元机器人官方称,实验结果表明 EnerVerse 不仅具备未来空间生成能力,更在机器人动作规划任务中实现了当前最优(SOTA)表现。IT之家从智元官方获悉,目前项目主页论文《EnerVerse:设想机器人操作的具身未来空间》已上线,模型与相关数据集即将开源。

图片

EnerVerse 主要科研成员来自智元机器人研究院具身算法团队。论文共同一作黄思渊是上海交通大学与上海人工智能实验室的联培博士生,师从 CUHK-MMLab 的李鸿升教授。博士期间的研究课题为基于多模态大模型的具身智能以及高效智能体的研究。在 CoRL、MM、 IROS、ECCV 等顶级会议上,以第一作者或共同第一作者身份发表多篇论文。另一位共同一作陈立梁是智元机器人的具身算法专家,主要负责具身空间智能与世界模型的研究。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知