Meta AI выпустила совместную встроенную предиктивную модель мира JEPA-WMs для физического планирования

Новости ME, сообщение от 3 апреля (UTC+8): исследовательская команда Meta AI Research опубликовала модель мира с совместным прогнозированием внедрений (JEPA-WMs) для физического планирования и связанные с ней исследования. В рамках этой работы рассматриваются ключевые факторы, обеспечивающие успех модели, и предоставляются полный код на PyTorch, набор данных и предобученные модели. Опубликованные модели включают базовую JEPA-WM, а также модели DINO-WM и V-JEPA-2-AC(fixed) в качестве базовых (baseline), и охватывают несколько роботизированных задач и навигационных сред, включая DROID & RoboCasa, Metaworld, Push-T, PointMaze и Wall. В модели используются визуальные энкодеры, такие как DINOv3 ViT-L/16, DINOv2 ViT-S/14 и V-JEPA-2 ViT-G/16; входное разрешение изображений в основном составляет 224×224 или 256×256. Проект также предоставляет опциональную декодирующую голову VM2M для визуализации и декодирования траекторий, но подчеркивается, что этот декодер не является обязательным для обучения world model или для проведения оценок планирования. Все ресурсы опубликованы на GitHub, Hugging Face и arXiv. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить