视觉地点识别的深度单应矩阵估计

AAAIFeb, 2024

视觉地点识别的深度单应矩阵估计

Deep Homography Estimation for Visual Place Recognition

Feng Lu, Shuting Dong, Lijun Zhang, Bingxi Liu, Xiangyuan Lan...

TL;DR通过基于 Transformer 的深度单应估计网络，利用密集特征图进行几何验证，以提高视觉地点识别的速度和精度。通过在无需额外标签的情况下联合训练主干网和单应估计网络，优化特征提取和局部匹配，实验证明该方法在性能上超过了多个最先进的方法，并且比使用 RANSAC 的传统分层 VPR 方法快一个数量级。

Abstract

visual place recognition (VPR) is a fundamental task for many applications such as robot localization and augmented reality. Recently, the hierarchical VPR methods have received considerable attention due to the trade-off between accuracy and efficiency. They usually first use global f

visual place recognition hierarchical vpr methods homography estimation transformer-based deep learning re-projection error

发现论文，激发创造

内容感知无监督深度单应矩阵估计

提出了一种无监督深度视觉几何估计方法来提高图像配准的精度，通过学习异常值掩模以去除噪声和提取更可靠的样本进行估计，使用 RANSAC 机制进行可靠区域选择，并专注于学习深度特征来计算损失，同时不忽略在真实场景中处理视差和运动物体的重要性。

Sep, 2019

一种数据和运行高效的分层地点识别流程的局部位置图和关注局部特征

本文提出了一种运行时和数据高效的分层视觉场所识别（VPR）管道，通过结合数据驱动和免训练方法，在降低训练数据和影响训练与应用阶段分布差异方面取得了良好的平衡，该方法在大规模应用中表现出了更好的性能。

Mar, 2024

实现预训练模型在视觉地点识别中的无缝适应

利用预训练的模型实现可视化地点识别的平滑适应，既全局又局部地适应预训练模型，通过轻量级适配器调整以产生适用于地点匹配的全局和局部特征，并避免耗时的空间验证，在少量数据和训练时间下超过当前最先进方法，并仅使用两阶段地点识别方法运行时间的约 3％，在 MSLS 挑战榜单上排名第 1。

Feb, 2024

使用连续地点描述符回归实现精准视觉定位的 CoPR 方法

该论文旨在提高基于图像的位置估计方法（Visual Place Recognition）的精度，作者通过提出一种连续的地点描述符回归方法（Continuous Place-descriptor Regression），在已有的参考图片上进行插值和外推，以增加参考图片的密度，通过实验结果发现该方法可以提高约 30% 的定位精度，相比使用视角不变损失函数，该方法可以额外提高约 15%。

Apr, 2023

无监督深度单应性：一种快速而强大的单应性估计模型

本研究提出一种无监督学习算法，利用深度卷积神经网络估算平面单应矩阵，相较于传统方法和监督式学习算法其具有更快的推理速度、更好的光照变化适应性和优于同类方法的性能表现。

Sep, 2017

深度图像单应性估计

该研究提出了一种利用卷积神经网络实现图像之间的变换估计的方法，可以避免传统的局部特征检测和变换估计方法的复杂度，并展示了多种基于深度估计变换的应用场景。

Jun, 2016

单视角深度估计下，从不同观点识别有变化的场景中的位置

本研究提出了一种新的深度 - 时间感知视觉地点识别系统，通过提取深度过滤关键点序列，对与单个查询图像中的关键点进行比较，解决了对立的视角和极端外观变化视觉地点识别问题，实验证明在多个基准数据集上表现优异，还进行了一系列模拟实验，以表征深度过滤关键点序列在关键域参数方面的贡献。

Feb, 2019

带有分级相似度监督的高效大规模场所识别

本论文提出了一种改进的视觉定位方法，通过使用连续相似性标签和广义对比损失函数代替传统的二元相似性标签和硬对样本挖掘，使得视觉识别表现得到了明显提升。

Mar, 2023

动态场景下的深度单应性估计

本篇论文研究并讨论如何设计和训练一种深度神经网络，以处理动态场景的单应性估计问题，通过多尺度网络进行设计和训练，在估计动态场景的单应性时，同时完成了动态内容检测的任务，使得该方法在具有挑战性的场景中具有较高的算法鲁棒性。

Apr, 2020

利用深度视觉描述符进行分层高效定位

该论文提出了一种利用深度学习技术进行分层定位的方法，仅在候选位置上计算 2D-3D 匹配的精确位姿估计，从而实现在流行的移动平台上实时运行并拥有最先进的本地化性能，为机器人研究带来了新的前景。

Sep, 2018