利用主要集合进行大规模图像地理定位
本文基于深度卷积神经网络,提出了一个新的框架,用于跨视角图像地理定位,包括 Faster R-CNN 和 Siamese 网络,并将其在一个新的数据集上进行了评估,结果表明该方法比其他方法具有更好的定位精度,并能够推广到未见过的位置。
Mar, 2017
该研究提出了一种基于二次优化问题与主导集的交互式图像分割的新方法,能够处理包括涂鸦、粗略轮廓和边框等任何输入方式,并在标准基准数据集上进行了实验,结果表明该方法相对于现有算法在各种自然图像下均具有优越性。
Aug, 2016
本文提出了一种基于部分匹配区域的方法,使用概率霍夫变换在多个对象类别的嘈杂图像集合中无监督地发现和定位支配对象,并在标准测试基准上证明了该方法在物体共现方面显著优于现有技术,可在具有挑战性的混合类数据集中实现鲁棒的对象发现。
Jan, 2015
本文研究基于图像的地理定位问题,通过在地图上确定地面视角的查询图像。我们提出了一种新的方法,通过 2.5D 空间中的结构高度来引导跨视图匹配,并借助多模态数据学习代表性嵌入。我们构建了第一个大规模的地面到 2.5D 地图地理定位数据集来验证我们的方法,并在单图像定位和路径定位等任务上进行了广泛实验,结果表明我们的方法在定位精度和收敛速度上明显优于之前的基于 2D 地图的方法。
Aug, 2023
本文提出了一种基于几何感知的地球到卫星图像地理定位方法,该方法可以实现对查询图像的精准定位,其精度可达卫星图像的像素级,同时提出了一种新的基于几何感知的图像检索流程,以提高定位准确性。
Mar, 2022
本文提出了将深度图像分类方法与原始的 Im2GPS 方法相结合,同时应用核密度估计来估计查询图片的地理位置,结果表明使用分类损失的网络训练比其他典型用于检索应用的深度特征学习方法(如对比学习和三元组损失的同构网络)表现更好,提高了地理定位的准确性并且需要更少的训练数据。
May, 2017
视觉地理定位方法的多阶段课程学习以及全局和局部特征的关键点检测、描述和位置调整使其成为一种实用的视觉地理定位解决方案,取得了高召回率的好成绩。
Nov, 2023
本文提出一种新颖的方法,通过识别和匹配道路和交叉口,实现对空中图像进行自动地理定位,并且使用 OpenStreetMap 收集地面真实道路注释,在数个实验中体现了高精度的本地化效果,同时还表明检测到的道路和以前手动标记的地图之间的几何对准可以有效地用于改进道路检测结果。
May, 2016
通过自监督学习图像的区域相似性,实现了对具有潜在难度的正面图像及其子区域的充分探索,并且在训练和推理中没有额外的参数或手动注释,能够有效地处理当前现有管道中的训练瓶颈
Jun, 2020
本文旨在使用卷积神经网络来解决跨视角图像地理定位的问题,并介绍了用于地面图像和航拍图像的特征表示,并提出一种融合多个空间尺度提取的特征的网络架构,并通过实验表明其比现有方法更为优越。
Oct, 2015