Jun, 2024

MeshVPR:基于 3D 网格的城市范围视觉地点识别

TL;DR通过使用稠密的三维纹理网格进行大规模视觉地点识别,我们发现使用合成基于网格的数据库进行视觉地点识别相比于真实世界图像的检索存在显著性能下降。为了解决这个问题,我们提出了 MeshVPR,这是一种利用轻量级特征对齐框架来弥合真实世界和合成领域差距的新型视觉地点识别管道。通过引入柏林、巴黎和墨尔本的新型数据集,我们进行了广泛的评估,证明了 MeshVPR 在标准视觉地点识别管道方面具有竞争力的性能,为基于网格的定位系统铺平了道路。