IJCAIOct, 2023

利用前沿的基于深度学习的图像匹配技术重建稀疏图像中的大场景

TL;DR我们提出了一个在 AISG-SLA 视觉定位挑战竞赛中获得第一名的解决方案,该任务是估计通过一个车载相机在城市场景中连续拍摄的图像之间的相对运动。我们使用我们最近基于深度学习的匹配器 RoMa 对图像进行匹配,并从中样本点进行相对运动估计,取得了非常有竞争力的成绩 - 在挑战竞赛中排名第三。为了提高估计准确度,我们提取图像中的关键点,使用 RoMa 进行匹配,并使用 COLMAP 进行结构运动重建。我们选择最近的 DeDoDe 关键点因其高可重复性。此外,为了解决图像序列中的时间跳跃问题,我们使用 DINOv2 进行图像检索,并匹配特定的非连续图像对。这些改进使我们的解决方案超过了所有竞争对手。我们还通过匹配手动选择的非连续图像对,给出了图像检索方法可达到的精度的上限。