Apr, 2024

SPVLoc: 未见环境中的6D相机定位的语义全景视口匹配

TL;DR本文介绍了SPVLoc,一种全球室内定位方法,能够准确确定查询图像的六维(6D)相机姿态,无需过多的现场特定先验知识和训练,采用了一种新颖的匹配过程,在室内环境的一组全景语义布局表示中定位了透视相机的视口,这些全景图由未贴图的3D参考模型渲染而成,仅包含关于房间形状的大致结构信息以及门窗标注。通过一个直接的卷积网络结构,我们展示了成功实现了图像到全景图以及图像到模型的匹配。通过视口分类得分,我们对参考全景图进行排名并选择最佳匹配的查询图像。然后,我们估计所选全景图与查询图像之间的六维相对姿态。我们的实验表明,这种方法不仅有效地弥合了领域差距,而且对先前未见过的训练数据之外的场景具有很好的泛化性能。此外,它在定位准确度上也比现有方法更优越,并且能估计更多自由度的相机姿态。我们将在此https URL上公开发布我们的源代码。