MeshVPR：基于 3D 网格的城市范围视觉地点识别

Jun, 2024

MeshVPR：基于 3D 网格的城市范围视觉地点识别

MeshVPR: Citywide Visual Place Recognition Using 3D Meshes

Gabriele Berton, Lorenz Junglas, Riccardo Zaccone, Thomas Pollok, Barbara Caputo...

TL;DR通过使用稠密的三维纹理网格进行大规模视觉地点识别，我们发现使用合成基于网格的数据库进行视觉地点识别相比于真实世界图像的检索存在显著性能下降。为了解决这个问题，我们提出了 MeshVPR，这是一种利用轻量级特征对齐框架来弥合真实世界和合成领域差距的新型视觉地点识别管道。通过引入柏林、巴黎和墨尔本的新型数据集，我们进行了广泛的评估，证明了 MeshVPR 在标准视觉地点识别管道方面具有竞争力的性能，为基于网格的定位系统铺平了道路。

Abstract

mesh-based scene representation offers a promising direction for simplifying large-scale hierarchical visual localization pipelines, combining a visual place recognition step based on global features (retrieval) and a visual localization step based on local features. While existing wor

mesh-based scene representation visual place recognition synthetic mesh-based databases meshvpr citywide mesh-based vpr

发现论文，激发创造

MeshLoc：基于网格的视觉定位

通过探索一种基于密集三维网格的更为灵活的方法，本文旨在解决基于图像的特征匹配对在构建场景表示上造成的代价，并通过在渲染场景几何图形时提取特征的方式，展示了这一方法达到了最新成果。结果表明，基于密集三维模型的表示是现有表示的一种有前途的替代方案，并且为未来研究提出了有趣而具有挑战性的方向。

Jul, 2022

NYC 室内长期视觉地点识别数据集与半自动标注

室内视觉地点识别对于人类和机器人的定位和导航具有益处。此论文介绍了 NYC-Indoor-VPR 数据集，它是纽约市 13 个不同拥挤场景的超过 36,000 张图片的独特且丰富的集合，这些图片采用了不同的光照条件和外观变化。为了建立视觉地点识别的基准，我们提出了一种半自动标注方法，通过计算每个图片的位置信息。最后，我们使用我们的标注数据集对几种最先进的视觉地点识别算法进行了基准评估，揭示了其挑战和对视觉地点识别研究的价值。

Mar, 2024

一种数据和运行高效的分层地点识别流程的局部位置图和关注局部特征

本文提出了一种运行时和数据高效的分层视觉场所识别（VPR）管道，通过结合数据驱动和免训练方法，在降低训练数据和影响训练与应用阶段分布差异方面取得了良好的平衡，该方法在大规模应用中表现出了更好的性能。

Mar, 2024

AnyLoc: 通向全球视觉地点识别的进展

通过使用通用特征表示和无监督特征聚合，本研究提出了一种适用于各种结构化和非结构化环境的通用视觉地点识别 (VPR) 解决方案，并取得了相较于现有方法高出 4 倍的显著性能提升，同时对特征进行语义属性建模获得 6% 的性能改善。

Aug, 2023

多尺度注意力学习视觉地点识别语义

本研究旨在通过多尺度注意力模块，实现从视觉和语义内容中学习鲁棒全局嵌入以及动态引导的分割过程，以提高视觉地点识别的准确性，同时提出第一个适用于地点识别和分割任务的合成世界数据集，实验证明方法在不同情景下具有良好性能。

Jan, 2022

实现预训练模型在视觉地点识别中的无缝适应

利用预训练的模型实现可视化地点识别的平滑适应，既全局又局部地适应预训练模型，通过轻量级适配器调整以产生适用于地点匹配的全局和局部特征，并避免耗时的空间验证，在少量数据和训练时间下超过当前最先进方法，并仅使用两阶段地点识别方法运行时间的约 3％，在 MSLS 挑战榜单上排名第 1。

Feb, 2024

VPR-Bench: 一个开源的视觉场所识别评估框架，可量化视点和外观变化

本研究提出了一个名为 “VPR-Bench” 的综合性开源框架，以帮助评估不同的视觉地点识别技术，该框架包含 12 个完全集成的数据集和 10 种 VPR 技术。通过应用和分析计算机视觉和机器人学界的流行评估指标，本文讨论了这些不同指标如何在不同应用和系统需求下相互补充和替代。

May, 2020

基于注册辅助的视觉地点识别聚合

使用新的特征聚合方法，通过注册器辅助模型训练，以获取具有辨别性地点信息的全局和局部特征，并通过重新分配注意力权重将这些注册器舍弃，从而实现对原始图像表示中不稳定特征的有效分离，其表现超过了现有方法

May, 2024

航空影像的视觉地点识别：一项调查

本文提出了一种特定于航空影像领域的评估 VPR 技术的方法，提供了各种方法及其性能的全面评估。文章不仅比较了各种 VPR 方法，还展示了在构建地图瓷砖时选择适当的缩放和重叠级别以实现最大效率的重要性。

Jun, 2024

BEV2PR: 带有结构提示的 BEV 增强型视觉地点识别

通过利用鸟瞰视角中的结构线索，我们提出了一种新的基于图像的视觉位置识别（VPR）框架。该框架能够仅基于单个摄像头生成具有视觉线索和空间感知的复合描述符。在我们收集的 VPR-NuScenes 数据集上的实验证明，与其他常用的基于相机的 VPR 聚合模块相比，我们的 BEV2PR 框架在 Recall@1 上取得了 2.47% 的绝对增益，并在难样本上取得了 18.06% 的增益。

Mar, 2024