Mar, 2025

以几何为基础的统一世界建模

TL;DR本研究解决了几何重建与生成建模的整合问题,提出了Aether框架,通过优化动态重建、动作条件的视频预测和目标条件的视觉规划,实现几何感知推理。Aether展现了在缺乏真实世界数据的情况下,依然能在重建和预测任务上实现零-shot泛化,其重建性能与领域特定模型相媲美,推动了物理合理的世界建模与应用的新前沿。