ECCVApr, 2022

世界上这张图片是在哪里?基于 Transformer 的野外地理定位

TL;DR本文提出了 TransLocator,这是一种基于双分支 Transformer 网络的方法,使用单一 RGB 图像和其语义分割图像进行地理定位和场景识别的多任务学习,其在四个基准数据集上均获得了比现有方法高的准确度。