Apr, 2023
3D-IntPhys:挑战场景下更加通用的三维视觉直观物理学
3D-IntPhys: Towards More Generalized 3D-grounded Visual Intuitive
Physics under Challenging Scenes
TL;DR本论文提出了一种通过学习多视角RGB图像预测场景未来发展的3D模型的框架,并使用条件神经辐射场视觉前端和3D基点动态预测后端来捕获底层环境的结构以及强关系和结构归纳偏差,相较于先前的方法,我们的模型对准确的点估计和跟踪不再具有依赖性,可以应对较复杂的场景,并在长时间预测方面表现较好。