室内视觉定位的几何语义姿态验证

Aug, 2019

室内视觉定位的几何语义姿态验证

Is This The Right Place? Geometric-Semantic Pose Verification for Indoor Visual Localization

Hajime Taira, Ignacio Rocco, Jiri Sedlar, Masatoshi Okutomi, Josef Sivic...

TL;DR本文提出了一种基于视觉、几何和语义多模式的姿态验证方法，并在室内场景数据集上取得了显著改善，该方法在增强现实和机器人等领域有广泛的实际应用价值。

Abstract

visual localization in large and complex indoor scenes, dominated by weakly textured rooms and repeating geometric patterns, is a challenging problem with high practical relevance for applications such as

visual localization indoor scenes pose verification geometric-semantic verification augmented reality

发现论文，激发创造

语义视觉定位

该论文提出了一种基于联合三维几何和语义理解的新方法来解决计算机视觉中困难的视觉定位问题，该方法使用生成模型进行描述符学习，并在语义场景补全作为辅助任务进行训练，以使得生成的三维描述符具有鲁棒性，并能够实现在极端视角，光照和几何变化下的可靠定位。

Dec, 2017

使用稀疏语义 3D 地图的视觉定位

本文提出了一种基于结构和图像的语义匹配方法，能够在诸如季节、亮度、天气和昼夜变化等多种条件下实现准确和稳健的视觉定位，实验证明该方法相较于现有技术有显著的提升。

Apr, 2019

InLoc: 室内稠密匹配和视角合成的视觉定位

本文研究了室内大规模定位中基于景深匹配和虚拟视图合成的视觉方法，通过收集新的大规模数据集进行实验，证明了该方法在 6DoF 姿态预测方面明显优于现有方法。

Mar, 2018

拥挤室内环境的大规模定位数据集

使用新型的激光雷达 SLAM 技术和结构运动优化方法在大型商场和地铁站获取室内数据集以便于在室内环境中进行视觉定位，并测试现代化的视觉定位算法，证明结构基方法使用健壮的图像特征具有更高的性能。

May, 2021

使用移动传感器进行长期视觉定位

本研究提出使用手机的 GPS、罗盘和重力传感器等附加传感器来解决室外场景下相机定位的挑战性问题，通过开发出直接的二维 - 三维匹配网络和采集公开数据集等手段，证明了该方法的有效性。

Apr, 2023

GS-Pose: 基于几何和语义一致的类别级目标姿态估计

类别级别姿态估计是一项具有挑战性的任务，近期深度学习方法取得了很大进展，但常常受到需要大量数据集或精心调整的逼真模拟器的限制。为了解决这个冲突，我们提出利用从预训练基础模型中获取的几何和语义特征，通过将 2D 特征从基础模型投影到三维空间来对单个类别的物体模型进行匹配，并在训练好的匹配网络上处理对未见物体实例的新的单视图观测，这比先前方法需要的数据量显著减少。我们通过丰富的评估结果表明了这一点，并展示了比先前方法更好的性能。

Nov, 2023

从姿态中隐式学习场景几何用于全局定位

通过利用少量的标签数据（即相机姿态），本文提出了一种学习方法，将这些标签与刚性对齐相结合，学习场景的三维几何表示，并将其用于估计相机的六自由度姿态，从而提高了定位的准确性。

Dec, 2023

几何姿态可供性：带场景约束的三维人体姿态

通过使用基于视觉的场景几何形状信息，我们提出了一种用于改善人体姿态估计的新颖机制：多层深度图。我们展示了这种方法可以提高 3D 姿态估计的精度。

May, 2019

大规模实时视觉惯性定位重访

本文提出了一种基于图像的定位方法，使用本地特征和稀疏的三维模型进行全球规模的离线和在线实时客户端姿态融合，实现低延迟本地化查询，证明了该方法在大规模模型上的有效性。

Jun, 2019

DASGIL: 面向语义和几何感知的基于图像的领域自适应定位

本文提出一种基于多任务架构的视觉定位方法，通过将几何和语义信息融合到多尺度的嵌入表示中，使用有效的多尺度特征鉴别器进行对抗性训练，从虚拟数据集到现实世界数据集的领域适应，以实现图像检索定位及大规模地点识别。该方法在 Extended CMU-Seasons 数据集和 Oxford RobotCar 数据集上进行验证，结果表明本方法在具有挑战性的环境下的检索定位和大规模地点识别的表现优于现有方法。

Oct, 2020