AAAIFeb, 2024

视觉地点识别的深度单应矩阵估计

TL;DR通过基于 Transformer 的深度单应估计网络,利用密集特征图进行几何验证,以提高视觉地点识别的速度和精度。通过在无需额外标签的情况下联合训练主干网和单应估计网络,优化特征提取和局部匹配,实验证明该方法在性能上超过了多个最先进的方法,并且比使用 RANSAC 的传统分层 VPR 方法快一个数量级。