Apr, 2023

3D-IntPhys:挑战场景下更加通用的三维视觉直观物理学

TL;DR本论文提出了一种通过学习多视角 RGB 图像预测场景未来发展的 3D 模型的框架,并使用条件神经辐射场视觉前端和 3D 基点动态预测后端来捕获底层环境的结构以及强关系和结构归纳偏差,相较于先前的方法,我们的模型对准确的点估计和跟踪不再具有依赖性,可以应对较复杂的场景,并在长时间预测方面表现较好。