利用位置上下文提高图像分类
本文提出了将深度图像分类方法与原始的 Im2GPS 方法相结合,同时应用核密度估计来估计查询图片的地理位置,结果表明使用分类损失的网络训练比其他典型用于检索应用的深度特征学习方法(如对比学习和三元组损失的同构网络)表现更好,提高了地理定位的准确性并且需要更少的训练数据。
May, 2017
本文采用卷积神经网络以及深度学习方法,通过对地球表面进行多尺度地理单元的细分,结合图像中的地标、天气模式、植被、道路标记和建筑细节等线索,利用海量地理标记图像进行分类,建立了一个名为 PlaNet 的模型,旨在通过照片图像实现定位识别,并结合长短时记忆神经网络,提高模型识别不确定图片的地理定位准确率。
Feb, 2016
本文系统考察了在细粒度图像分类中,如何利用地理位置信息来提高分类准确性,通过发布两个带有地理位置信息的数据集,实验结果表明,使用地理位置信息可以将模型的准确性从 70.1% 提高到 79.0%。研究还发现,针对资源有限的模型,建议使用特征调节模型,可以将模型准确性从 59.6% 提高到 72.2%。
Jun, 2019
本文提出了一种利用普通地面图像和低精度手机 GPS 训练地理空间深度神经网络以准确预测车辆地理位置 (纬度和经度) 的方法。我们在一个公开数据集和我们自己采集的在雾都旧金山市中心的图像上验证了该方法,结果表明模型可以在实际业务应用中足够预测质量位置,同时避免了使用地图或 SFM 模型的当今经典视觉定位或姿态估计方法所遇到的问题。
Apr, 2018
该篇论文研究了如何通过使用人类编写的指南书中的知识来改善地理定位任务,并提出了一种通过使用 StreetView 图像数据集和 GeoGuessr 的文本指南进行地理定位的方法,该方法可以通过从指南书中自动提取的线索来预测每张图像的国家,并使用伪标签来监督地学习,明显优于现有的只使用图像的地理定位方法。
Nov, 2022
本文基于深度卷积神经网络,提出了一个新的框架,用于跨视角图像地理定位,包括 Faster R-CNN 和 Siamese 网络,并将其在一个新的数据集上进行了评估,结果表明该方法比其他方法具有更好的定位精度,并能够推广到未见过的位置。
Mar, 2017
本文介绍了一种基于 CNN 模型的场所识别技术,在空间和时间维度上使用组合得到 CNN 模型的强大特征,并应用于一些基准数据集进行评估,该技术在召回率上取得了 75%的提升和 100%精度,明显优于之前所有的最新技术。在本文中,还对所有 21 个层的特征进行了全面的性能比较,包括基准数据集和一个具有更大视角变化的第二个数据集。
Nov, 2014
本文提出了一种基于街景图像的自动检测并计算感兴趣的重复固定对象的 GPS 坐标的方法,使用两个全卷积神经网络进行处理并使用一种新颖的自定义马尔可夫随机场模型进行三角化,实验证明了本方法的有效性。
Aug, 2017
本文提出了一种车载摄像机定位的解决方案,通过神经网络和几何投影模型实现从地面图像匹配到高空卫星地图上,并把匹配问题转化为姿态估计问题来提高定位精度。
Apr, 2022