从单张图片中确定二维地图上的位置和朝向:Flatlandia 定位问题与数据集
本文研究基于图像的地理定位问题,通过在地图上确定地面视角的查询图像。我们提出了一种新的方法,通过 2.5D 空间中的结构高度来引导跨视图匹配,并借助多模态数据学习代表性嵌入。我们构建了第一个大规模的地面到 2.5D 地图地理定位数据集来验证我们的方法,并在单图像定位和路径定位等任务上进行了广泛实验,结果表明我们的方法在定位精度和收敛速度上明显优于之前的基于 2D 地图的方法。
Aug, 2023
本文提出了一种基于几何感知的地球到卫星图像地理定位方法,该方法可以实现对查询图像的精准定位,其精度可达卫星图像的像素级,同时提出了一种新的基于几何感知的图像检索流程,以提高定位准确性。
Mar, 2022
论文提出了 OrienterNet,这是一个可以使用 2D 语义地图对图像进行亚米级别本地化的深度神经网络,通过匹配神经鸟瞰与来自 OpenStreetMap 的开放和全球可用地图,可以使任何人在这些地图提供的地方进行本地化。 OrienterNet 通过监督相机姿势进行训练,但学习以端到端的方式执行与地图元素的语义匹配,具有广泛的泛化能力,代码和训练模型将公开发布。
Apr, 2023
使用街景图像进行定位时,精细定位角度的准确度对于提高街景图像的定位和地理定位任务的性能至关重要。本研究提出了两种方法,实现了对街景图像角度的细致估计,相较于以前的方法,准确度提高了 34.9% 至 28.2%。在训练中整合了精细定位角度估计,进一步提升了地理定位的性能。
Jul, 2023
使用 2D 标签和对象运动的物理知识,我们提出了一种新颖的方法,可以从单个校准摄像机的单个图像中精确地定位 3D 对象的位置,而无需昂贵的 3D 标签,即使在训练期间从未见过这些信息,我们的模型也能推断出潜在的第三维度。通过在合成和真实数据集上评估,我们的方法在真实数据实验中能够达到均方误差仅为 6 厘米,结果表明这种方法在无法收集 3D 数据进行训练的情况下学习 3D 对象定位估计的潜力。
Oct, 2023
本论文提出了一种在具有不同平面的路面上进行单目物体定位和形状估计的方法,并使用 KITTI 和 SYNTHIA-SF 基准测试了该方法,证明了其在任意形状的路面上能显著提高单目物体定位的效果。
Mar, 2018
本研究提出了一种新颖的地球观测方法,通过利用航空 LiDAR 数据对卫星影像进行训练,学习得到高度,姿态等地心位姿信息,并开展仿射不变性实验,实现优于现有方法的性能表现。
May, 2021
本文提出了一种从单个校准图像中实现三维篮球定位的新方法,通过预测对象在图像空间中的像素高度,并利用图像本身和对象的位置作为输入,估计其在图像中投影到地平面上,并利用已知的投影矩阵重建篮球的三维坐标,实验结果表明该方法相对于最近的研究取得了显著的精度改进,从而为提高球类跟踪和理解的可能性开辟了新的空间,推动了计算机视觉在不同领域的发展。
Sep, 2023
提出了一种无需建立场景特定三维地图的场景单图参考图像重定位技术,并通过对世界范围内的小型艺术品,如雕塑、壁画和喷泉的构建新数据集,测试了现有算法的可行性及基准结果,并发现无地图重定位仍需新型创新技术的挑战。
Oct, 2022
该论文提出了一种新的方法来在基于学习低维嵌入空间的 2D 地图上定位全景图像,当使用谷歌街景和开放街地图数据时,通过沿路径连接多个图像来快速收敛,可以实现多达 200 米左右长度的路线的 90%的精度,方法普适性强且比使用前面基于固定语义特征的方法具有更高的定位精度和更快的收敛速度。
Nov, 2019