从单张图片中确定二维地图上的位置和朝向：Flatlandia 定位问题与数据集

Apr, 2023

从单张图片中确定二维地图上的位置和朝向：Flatlandia 定位问题与数据集

You are here! Finding position and orientation on a 2D map from a single image: The Flatlandia localization problem and dataset

PDF

Matteo Toso, Matteo Taiana, Stuart James, Alessio Del Bue

TL;DRFlatlandia 是一个解决由两个特定任务组成的视觉定位问题的创新性问题，包括粗略地图定位和细粒度 3DoF 定位，开发人员使用提供的 Flatlandia 数据集进行验证。

Abstract

We introduce Flatlandia, a novel problem for visual localization of an image from object detections composed of two specific tasks: i) Coarse Map Localization: localizing a single image observing a set of objects in respect to a 2D map of object landmarks; ii) →

visual localization object detection fine-grained 3dof localization urban maps flatlandia dataset

发现论文，激发创造

基于图像的地理定位通过地面到 2.5D 地图匹配

本文研究基于图像的地理定位问题，通过在地图上确定地面视角的查询图像。我们提出了一种新的方法，通过 2.5D 空间中的结构高度来引导跨视图匹配，并借助多模态数据学习代表性嵌入。我们构建了第一个大规模的地面到 2.5D 地图地理定位数据集来验证我们的方法，并在单图像定位和路径定位等任务上进行了广泛实验，结果表明我们的方法在定位精度和收敛速度上明显优于之前的基于 2D 地图的方法。

Aug, 2023

通过地对卫图像匹配实现准确的三自由度相机地理定位

本文提出了一种基于几何感知的地球到卫星图像地理定位方法，该方法可以实现对查询图像的精准定位，其精度可达卫星图像的像素级，同时提出了一种新的基于几何感知的图像检索流程，以提高定位准确性。

Mar, 2022

OrienterNet：使用神经匹配在 2D 公共地图中进行视觉定位

论文提出了 OrienterNet，这是一个可以使用 2D 语义地图对图像进行亚米级别本地化的深度神经网络，通过匹配神经鸟瞰与来自 OpenStreetMap 的开放和全球可用地图，可以使任何人在这些地图提供的地方进行本地化。 OrienterNet 通过监督相机姿势进行训练，但学习以端到端的方式执行与地图元素的语义匹配，具有广泛的泛化能力，代码和训练模型将公开发布。

Apr, 2023

超越地理定位：通过卫星图像与街景图像进行交叉视角匹配的细粒度街景图像定向

使用街景图像进行定位时，精细定位角度的准确度对于提高街景图像的定位和地理定位任务的性能至关重要。本研究提出了两种方法，实现了对街景图像角度的细致估计，相较于以前的方法，准确度提高了 34.9% 至 28.2%。在训练中整合了精细定位角度估计，进一步提升了地理定位的性能。

Jul, 2023

利用运动物理定律从 2D 标签学习单目三维物体定位

使用 2D 标签和对象运动的物理知识，我们提出了一种新颖的方法，可以从单个校准摄像机的单个图像中精确地定位 3D 对象的位置，而无需昂贵的 3D 标签，即使在训练期间从未见过这些信息，我们的模型也能推断出潜在的第三维度。通过在合成和真实数据集上评估，我们的方法在真实数据实验中能够达到均方误差仅为 6 厘米，结果表明这种方法在无法收集 3D 数据进行训练的情况下学习 3D 对象定位估计的潜力。

Oct, 2023

地球并非平坦：移动相机对陡峭和倾斜道路上车辆的单目重建

本论文提出了一种在具有不同平面的路面上进行单目物体定位和形状估计的方法，并使用 KITTI 和 SYNTHIA-SF 基准测试了该方法，证明了其在任意形状的路面上能显著提高单目物体定位的效果。

Mar, 2018

野外单视图地心姿态

本研究提出了一种新颖的地球观测方法，通过利用航空 LiDAR 数据对卫星影像进行训练，学习得到高度，姿态等地心位姿信息，并开展仿射不变性实验，实现优于现有方法的性能表现。

May, 2021

从单个校准图像中的上下文感知三维物体定位：篮球的研究

本文提出了一种从单个校准图像中实现三维篮球定位的新方法，通过预测对象在图像空间中的像素高度，并利用图像本身和对象的位置作为输入，估计其在图像中投影到地平面上，并利用已知的投影矩阵重建篮球的三维坐标，实验结果表明该方法相对于最近的研究取得了显著的精度改进，从而为提高球类跟踪和理解的可能性开辟了新的空间，推动了计算机视觉在不同领域的发展。

Sep, 2023

无地图视觉重定位：基于单张图像的度量位姿

提出了一种无需建立场景特定三维地图的场景单图参考图像重定位技术，并通过对世界范围内的小型艺术品，如雕塑、壁画和喷泉的构建新数据集，测试了现有算法的可行性及基准结果，并发现无地图重定位仍需新型创新技术的挑战。

Oct, 2022

嵌入地图和图像的地理定位

该论文提出了一种新的方法来在基于学习低维嵌入空间的 2D 地图上定位全景图像，当使用谷歌街景和开放街地图数据时，通过沿路径连接多个图像来快速收敛，可以实现多达 200 米左右长度的路线的 90％的精度，方法普适性强且比使用前面基于固定语义特征的方法具有更高的定位精度和更快的收敛速度。

Nov, 2019