Apr, 2024

大规模场景中单目相机的深度、位姿和隐式场景表示的增量联合学习

TL;DR我们提出了一种增量联合学习框架,通过采用基于视觉变换器的网络作为主干来实现准确的深度、姿态估计和大规模场景重建,并构建了增量场景表示方法以增强三维场景表示的可伸缩性。