Jun, 2024

自监督预训练和微调用于单目深度和视觉里程计

TL;DR我们提出了一种使用自监督变换器模型进行单目深度和视觉里程计估计任务的方法,分为两个步骤:第一步是使用跨视角补全目标(CroCo)进行通用预训练以学习 3D 几何,然后在非标注视频上进行自监督微调。我们展示了我们的自监督模型可以通过使用视觉变换器、密集预测变换器和适配器等标准组件达到最先进的性能。通过在六个基准数据集上进行评估,包括静态和动态、室内和室外、合成和真实图像,我们证明了我们提出方法的有效性,尤其在深度预测任务中超过了最先进的方法。