Meta AI发布用于物理规划的联合嵌入预测世界模型JEPA-WMs

ME News 消息,4 月 3 日(UTC+8),Meta AI Research团队发布了用于物理规划的联合嵌入预测世界模型JEPA-WMs及其相关研究。该研究探讨了模型成功的关键因素,并提供了完整的PyTorch实现、数据集和预训练模型。发布的模型包括核心的JEPA-WM以及作为基线的DINO-WM和V-JEPA-2-AC(fixed)模型,覆盖DROID & RoboCasa、Metaworld、Push-T、PointMaze和Wall等多个机器人操作与导航环境。模型采用了DINOv3 ViT-L/16、DINOv2 ViT-S/14和V-JEPA-2 ViT-G/16等视觉编码器,输入图像分辨率主要为224×224或256×256。项目还提供了可选的VM2M解码器头用于可视化和轨迹解码,但强调该解码器对于训练世界模型或进行规划评估并非必需。所有资源已在GitHub、Hugging Face和arXiv上公开。(来源:InFoQ)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论