深度学习时代的 IM2GPS 重访

May, 2017

Revisiting IM2GPS in the Deep Learning Era

Nam Vo, Nathan Jacobs, James Hays

TL;DR本文提出了将深度图像分类方法与原始的 Im2GPS 方法相结合，同时应用核密度估计来估计查询图片的地理位置，结果表明使用分类损失的网络训练比其他典型用于检索应用的深度特征学习方法（如对比学习和三元组损失的同构网络）表现更好，提高了地理定位的准确性并且需要更少的训练数据。

Abstract

image geolocalization, inferring the geographic location of an image, is a challenging computer vision problem with many potential applications. The recent state-of-the-art approach to this problem is a deep image class

image geolocalization deep image classification im2gps approach kernel density estimation deep feature learning

发现论文，激发创造

通过地面图像和手机 GPS 定位的准确深度直接地理定位

本文提出了一种利用普通地面图像和低精度手机 GPS 训练地理空间深度神经网络以准确预测车辆地理位置 (纬度和经度) 的方法。我们在一个公开数据集和我们自己采集的在雾都旧金山市中心的图像上验证了该方法，结果表明模型可以在实际业务应用中足够预测质量位置，同时避免了使用地图或 SFM 模型的当今经典视觉定位或姿态估计方法所遇到的问题。

Apr, 2018

利用位置上下文提高图像分类

本研究通过利用 GPS 坐标，探索了将位置信息与卷积神经网络相结合进行图像分类的方法，并在 Yahoo Flickr Creative Commons 100M 数据集的子集上进行了评估，证明了这种方法可以使平均精度提高近 7%。

May, 2015

Img2Loc: 通过多模态基础模型和基于图像检索增强的生成，重新审视图像地理定位

Img2Loc 是一个采用 GPT4V 或 LLaVA 等大型多模态模型进行检索增强生成的创新系统，通过重新定义图像地理定位作为文本生成任务，它不仅在 Im2GPS3k 和 YFCC4k 等基准数据集上超过了先前最先进的模型的性能，而且在没有任何模型训练的情况下做到了这一点。

Mar, 2024

利用航空参考图像进行广域图像地理定位

本文旨在使用卷积神经网络来解决跨视角图像地理定位的问题，并介绍了用于地面图像和航拍图像的特征表示，并提出一种融合多个空间尺度提取的特征的网络架构，并通过实验表明其比现有方法更为优越。

Oct, 2015

城市环境下的跨视角图像匹配用于地理定位

本文基于深度卷积神经网络，提出了一个新的框架，用于跨视角图像地理定位，包括 Faster R-CNN 和 Siamese 网络，并将其在一个新的数据集上进行了评估，结果表明该方法比其他方法具有更好的定位精度，并能够推广到未见过的位置。

Mar, 2017

为跨视图地理定位的神经网络引入贷款方向

本文提出一种基于方向信息的神经网络模型，应用于图像地理定位问题中，使用角度编码方式让神经网络更好的提取特征，使该模型在地理位置定位方面表现出较高的正确率和精度。

Mar, 2019

利用 EfficientNet 和对比学习进行精准的全球位置估计

本文提出了一种混合分类 - 检索方案，其中利用 EfficientNet 架构将图像分配到特定的地理单元，并使用训练有素的残差架构将输入图像映射到一个嵌入空间，以最小化相同位置图像的配对测地线距离，然后将两个模块与空间聚类方案相结合，通过搜索 - 单元内的聚合确定最终位置估计。结果表明，该方法的性能非常竞争，在 4 个公共数据集上均能取得新的最优表现。

May, 2021

可解释的语义化照片地理定位

介绍了使用语义分割和特征分析方法来提高星球级照片定位准确性和可解释性。

Apr, 2021

面向细粒度识别的地理感知网络

本文系统考察了在细粒度图像分类中，如何利用地理位置信息来提高分类准确性，通过发布两个带有地理位置信息的数据集，实验结果表明，使用地理位置信息可以将模型的准确性从 70.1% 提高到 79.0%。研究还发现，针对资源有限的模型，建议使用特征调节模型，可以将模型准确性从 59.6% 提高到 72.2%。

Jun, 2019

PlaNet - 基于卷积神经网络进行照片地理定位

本文采用卷积神经网络以及深度学习方法，通过对地球表面进行多尺度地理单元的细分，结合图像中的地标、天气模式、植被、道路标记和建筑细节等线索，利用海量地理标记图像进行分类，建立了一个名为 PlaNet 的模型，旨在通过照片图像实现定位识别，并结合长短时记忆神经网络，提高模型识别不确定图片的地理定位准确率。

Feb, 2016