多尺度注意力学习视觉地点识别语义

Jan, 2022

多尺度注意力学习视觉地点识别语义

Learning Semantics for Visual Place Recognition through Multi-Scale Attention

Valerio Paolicelli, Antonio Tavera, Carlo Masone, Gabriele Berton, Barbara Caputo

TL;DR本研究旨在通过多尺度注意力模块，实现从视觉和语义内容中学习鲁棒全局嵌入以及动态引导的分割过程，以提高视觉地点识别的准确性，同时提出第一个适用于地点识别和分割任务的合成世界数据集，实验证明方法在不同情景下具有良好性能。

Abstract

In this paper we address the task of visual place recognition (VPR), where the goal is to retrieve the correct GPS coordinates of a given query image against a huge geotagged gallery. While recent works have show

visual place recognition geotagged gallery global embeddings semantic content multi-scale attention

发现论文，激发创造

基于语义增强的注意力学习用于视觉地点识别

本文提出了一种基于语义增强的注意力学习网络方法，该方法利用本地加权方案和语义先验信息提高视觉地点识别（VPR）任务的表现，并在城市级别的 VPR 基准数据集上实现了优越性能。

Aug, 2021

基于 Transformer 的多层注意力聚合地点识别

本文介绍了一种新颖的基于 Transformer 的全局位置识别模型 TransVPR，该模型在多尺度上聚合任务相关特征，并通过空间匹配实现对全局视觉特征的候选人重新排序，具有最先进的性能并且计算时间和存储要求相对较低。

Jan, 2022

基于注册辅助的视觉地点识别聚合

使用新的特征聚合方法，通过注册器辅助模型训练，以获取具有辨别性地点信息的全局和局部特征，并通过重新分配注意力权重将这些注册器舍弃，从而实现对原始图像表示中不稳定特征的有效分离，其表现超过了现有方法

May, 2024

带有分级相似度监督的高效大规模场所识别

本论文提出了一种改进的视觉定位方法，通过使用连续相似性标签和广义对比损失函数代替传统的二元相似性标签和硬对样本挖掘，使得视觉识别表现得到了明显提升。

Mar, 2023

注意力感知对年龄无关的视觉地点识别

本研究提出了一种跨域视觉地点识别任务，使用年龄不变的特征学习卷积神经网络和注意聚合模块实现跨域匹配不同领域中同一建筑物的图像，达到了 99% 的单域匹配和 20% 的跨域匹配的最佳成果。

Sep, 2019

一种数据和运行高效的分层地点识别流程的局部位置图和关注局部特征

本文提出了一种运行时和数据高效的分层视觉场所识别（VPR）管道，通过结合数据驱动和免训练方法，在降低训练数据和影响训练与应用阶段分布差异方面取得了良好的平衡，该方法在大规模应用中表现出了更好的性能。

Mar, 2024

NYC 室内长期视觉地点识别数据集与半自动标注

室内视觉地点识别对于人类和机器人的定位和导航具有益处。此论文介绍了 NYC-Indoor-VPR 数据集，它是纽约市 13 个不同拥挤场景的超过 36,000 张图片的独特且丰富的集合，这些图片采用了不同的光照条件和外观变化。为了建立视觉地点识别的基准，我们提出了一种半自动标注方法，通过计算每个图片的位置信息。最后，我们使用我们的标注数据集对几种最先进的视觉地点识别算法进行了基准评估，揭示了其挑战和对视觉地点识别研究的价值。

Mar, 2024

跨域视觉地点识别仅需要本地特征吗？

本文研究使用基于空间验证的重新排序方法尝试解决视觉地方识别中光照和遮挡等困难问题，并给出了新的综合基准和两个具有挑战性的数据集。

Apr, 2023

SeqNet: 基于序列的分层地点识别描述符学习

本文提出一种新型混合系统，使用 SeqNet 生成临时描述符，并结合单图片学习描述符进行选择性控制序列得分汇总，以创建高性能初始匹配假设生成器，进而在挑战性基准数据集上达到超越现有最先进方法的效果。

Feb, 2021

基于 Spatio-Semantic ConvNet 的视觉地点识别

该研究提出了一种采用卷积神经网络（VGG16）的激活层对地点图像进行编码的视觉地点识别系统。该系统采用了类似于图像检索流程的两阶段方法，并在第二阶段使用 CNN 特征来编码语义和空间信息，其效果在常见基准数据集上明显优于其他方法。

Sep, 2019