本文提出了一种利用普通地面图像和低精度手机 GPS 训练地理空间深度神经网络以准确预测车辆地理位置 (纬度和经度) 的方法。我们在一个公开数据集和我们自己采集的在雾都旧金山市中心的图像上验证了该方法,结果表明模型可以在实际业务应用中足够预测质量位置,同时避免了使用地图或 SFM 模型的当今经典视觉定位或姿态估计方法所遇到的问题。
Apr, 2018
本研究通过利用 GPS 坐标,探索了将位置信息与卷积神经网络相结合进行图像分类的方法,并在 Yahoo Flickr Creative Commons 100M 数据集的子集上进行了评估,证明了这种方法可以使平均精度提高近 7%。
May, 2015
Img2Loc 是一个采用 GPT4V 或 LLaVA 等大型多模态模型进行检索增强生成的创新系统,通过重新定义图像地理定位作为文本生成任务,它不仅在 Im2GPS3k 和 YFCC4k 等基准数据集上超过了先前最先进的模型的性能,而且在没有任何模型训练的情况下做到了这一点。
Mar, 2024
本文旨在使用卷积神经网络来解决跨视角图像地理定位的问题,并介绍了用于地面图像和航拍图像的特征表示,并提出一种融合多个空间尺度提取的特征的网络架构,并通过实验表明其比现有方法更为优越。
Oct, 2015
本文基于深度卷积神经网络,提出了一个新的框架,用于跨视角图像地理定位,包括 Faster R-CNN 和 Siamese 网络,并将其在一个新的数据集上进行了评估,结果表明该方法比其他方法具有更好的定位精度,并能够推广到未见过的位置。
Mar, 2017
本文提出一种基于方向信息的神经网络模型,应用于图像地理定位问题中,使用角度编码方式让神经网络更好的提取特征,使该模型在地理位置定位方面表现出较高的正确率和精度。
Mar, 2019
本文提出了一种混合分类 - 检索方案,其中利用 EfficientNet 架构将图像分配到特定的地理单元,并使用训练有素的残差架构将输入图像映射到一个嵌入空间,以最小化相同位置图像的配对测地线距离,然后将两个模块与空间聚类方案相结合,通过搜索 - 单元内的聚合确定最终位置估计。结果表明,该方法的性能非常竞争,在 4 个公共数据集上均能取得新的最优表现。
May, 2021
介绍了使用语义分割和特征分析方法来提高星球级照片定位准确性和可解释性。
Apr, 2021
本文系统考察了在细粒度图像分类中,如何利用地理位置信息来提高分类准确性,通过发布两个带有地理位置信息的数据集,实验结果表明,使用地理位置信息可以将模型的准确性从 70.1% 提高到 79.0%。研究还发现,针对资源有限的模型,建议使用特征调节模型,可以将模型准确性从 59.6% 提高到 72.2%。
Jun, 2019
本文采用卷积神经网络以及深度学习方法,通过对地球表面进行多尺度地理单元的细分,结合图像中的地标、天气模式、植被、道路标记和建筑细节等线索,利用海量地理标记图像进行分类,建立了一个名为 PlaNet 的模型,旨在通过照片图像实现定位识别,并结合长短时记忆神经网络,提高模型识别不确定图片的地理定位准确率。
Feb, 2016