基于图的语义多视角定位 (X-View)

Sep, 2017

X-View: Graph-Based Semantic Multi-View Localization

Abel Gawel, Carlo Del Don, Roland Siegwart, Juan Nieto, Cesar Cadena

TL;DR本研究提出一种基于语义图描述符匹配的多视野语义全局化系统 X-View，实现了在不同视角条件下的全局本体识别，可应用于地面至空中、以及地面至地面搬运机器人数据，准确率达 85%。

Abstract

Global registration of multi-view robot data is a challenging task. Appearance-based global localization approaches often fail under drastic view-point changes, as representations have limited view-point invarian

multi-view robot data global localization semantic graph descriptor matching visual data x-view

发现论文，激发创造

语义视觉定位

该论文提出了一种基于联合三维几何和语义理解的新方法来解决计算机视觉中困难的视觉定位问题，该方法使用生成模型进行描述符学习，并在语义场景补全作为辅助任务进行训练，以使得生成的三维描述符具有鲁棒性，并能够实现在极端视角，光照和几何变化下的可靠定位。

Dec, 2017

视图一致净化：实现准确的跨视图定位

本文提出了一种细粒度的室外机器人自定位方法，利用可调数量的机载摄像头和易获取的卫星图像；该方法解决了现有的跨视角定位方法因移动物体和季节变化等噪声源的问题；通过从地面和卫星视图中检测一致的关键点和它们对应的深度特征，去除离地物体，并在两个视图之间建立同伦变换，该方式是第一个仅利用视觉的稀疏方法，以提高动态环境下的感知能力；此外，该方法采用空间嵌入方法，利用相机内外参数信息降低纯视觉匹配的歧义性，从而提高特征匹配和姿态估计的准确性。通过在 KITTI 和 Ford Multi-AV Seasonal 数据集上进行大量实验，证明了该方法优于现有的最先进方法，能够实现横向和纵向方向上低于 0.5 米的中位空间准确性误差，以及小于 2 度的中位方向准确性误差。

Aug, 2023

语义跨视图匹配

本研究提出了一种自动检测和表示 RGB 图像语义信息的方法，以实现与非 RGB 地理信息系统（GIS）进行跨视图匹配，利用由语义概念（如交通标志、湖泊、道路、植被等）分配的图像分割区域进行描述符的设计和匹配。实验证明此方法有效。

Oct, 2015

使用稠密不确定度估计的视觉跨视图度量定位

本文使用新型网络结构和更密集的卫星图像描述符进行多模式区域定位，可将度量定位误差中位数相对于同一区域、跨区域和跨时间的现有技术分别降低 51％、37％和 28％。

Aug, 2022

跨视角地理定位：综述

本文针对跨视域地理定位领域的前沿方法、技术和挑战进行了综述，着重介绍了基于特征和深度学习策略。研究涵盖了建立不同视点之间对应关系的基于特征的方法，以及采用卷积神经网络嵌入视图不变属性的深度学习方法。对跨视域地理定位遇到的各种挑战进行了探讨，如视点和照明的变化、遮挡的发生，并提出了相应的创新解决方案。此外，本文介绍了基准数据集和评估指标，并对最先进技术进行了比较分析。最后，对未来研究以及跨视域地理定位在全球复杂网络环境中蓬勃发展的应用进行了讨论。

Jun, 2024

使用稀疏语义 3D 地图的视觉定位

本文提出了一种基于结构和图像的语义匹配方法，能够在诸如季节、亮度、天气和昼夜变化等多种条件下实现准确和稳健的视觉定位，实验证明该方法相较于现有技术有显著的提升。

Apr, 2019

从合成的场景图进行的跨视图自定位

通过将原始图像的视图不变外观特征和合成图像的视图依赖空间 - 语义特征相结合，利用图神经网络进行压缩学习和识别，该方法在一个包含多个未见过视觉的交叉视图自定位数据集中得到了验证。

Oct, 2023

基于卫星图像的地理定位

本文针对在地面视图图像查询给定地理参考卫星地图的定位问题提出了一种基于 CVM-Net 的 Markov 定位框架，通过更广泛的实验结果和分析，它扩展了我们早期关于 CVM-Net 的工作，并提出了一种 Markov 定位框架，该框架可以在可用的地面图像流视频的情况下增强地理定位结果。实验结果表明，我们提出的 Markov 定位框架可以在新加坡数据集上持续实现小误差内的车辆定位。

Mar, 2019

卫星到街景合成用于地理定位

该论文介绍了一种利用多任务架构，通过学习从卫星图像合成逼真街景的方法来解决街景图像地理定位的问题，并在 CVUSA 和 CVACT 基准测试中取得了最先进的表现。

Mar, 2021

跨视角语义分割感知环境

为了提高机器人感知周围环境的能力，本研究提出了一种名为 Cross-view Semantic Segmentation 的视觉任务并推出了 View Parsing Network（VPN）框架来解决该任务，该任务能够将第一视角的观测数据转化为顶视图的物体语义分割图，表示出所有物体在像素层级的空间位置。通过在 3D 图形环境中训练 VPN 并使用域自适应技术将其转移到处理现实环境的数据，本研究证明了在实验中，VPN 显著提高了机器人理解空间信息的能力。

Jun, 2019