CVPRMar, 2023

使用层次和场景的基于查询的全球图像地理定位

TL;DR我们提出了一种基于 Transformer 的端到端架构,通过层次交叉注意力利用不同地理层次和相应的视觉场景信息来确定照片的确切纬度和经度,实现了在四个标准地理位置数据集上的最新成果,并介绍了一个更困难的测试数据集,从 Google Streetview 中覆盖整个地球,并呈现出最新的结果。