基于图像的定位的场景坐标和对应关系学习

May, 2018

基于图像的定位的场景坐标和对应关系学习

Scene Coordinate and Correspondence Learning for Image-Based Localization

Mai Bui, Shadi Albarqouni, Slobodan Ilic, Nassir Navab

TL;DR本篇论文提出了一种使用深度学习，通过像素级的场景坐标回归来进行相机姿态估计的方法，并通过回归的置信度值对相应的姿态进行自我校正和提高精度。

Abstract

Scene coordinate regression has become an essential part of current camera re-localization methods. Different versions, such as regression forests and →

camera re-localization regression deep learning rgb images pose estimation

发现论文，激发创造

基于图像的定位的全幅场景坐标回归

采用全帧方式进行场景坐标回归可以在测试时间内提高计算效率并增加回归过程的全局上下文以提高稳健性，而数据增强则有助于减轻过度拟合问题，从而提高基于图像识别的定位场景坐标预测的鲁棒性。

Feb, 2018

视觉定位的分层场景坐标分类和回归

本研究提出了一种新的基于层次场景坐标网络的方法，用于从单个 RGB 图像中逐步预测像素场景坐标，并在单幅图像中取得了新的最佳单色彩 RGB 定位性能，同时也减小了性能差距。

Sep, 2019

基于角度重投影误差的场景坐标回归在相机重新定位中的应用

本文提出一种基于新的角度重投影误差损失方法的卷积神经网络训练方式，在无需精确初始化的情况下能够获得更准确的结果，并且可以利用多视角约束来进一步提高性能。

Aug, 2018

学习少即是多 - 通过三维表面回归实现六自由度相机定位

本文针对如何从单个 RGB 图像中在给定的 3D 环境中预测 6D 相机姿态这一问题，通过设计并使用一个名为完全卷积神经网络的组件实现了高效、高精度和鲁棒性训练的端到端可训练的管道。令人惊奇的是，网络仅依靠单一视角的约束条件即可自动发现 3D 场景几何，甚至在没有利用场景 3D 模型的情况下，也能比现有技术更优秀。

Nov, 2017

基于全局唯一实例坐标回归的大规模联合语义重定位与场景理解

本研究提出了一种新颖的联合语义本地化和场景理解方法，通过训练卷积神经网络，通过物体实例的自我表征和 6-DoF 相机姿态预测来实现 3D 场景坐标估计，并且相比直接姿态回归或基于场景坐标的姿态估计算法更加准确。

Sep, 2019

使用重新本地化级联实时估计新场景中的 RGB-D 摄像机姿态

本文提出了一种改进的方法来解决摄像机位姿估计问题，利用回归森林对场景中的关键点进行对应，采用几何方法评分并选择最有前途的假设，使用多个快速但不精确的重新定位器级联，调整参数以实现有效的性能，实现了重定位性能的显着提升。

Oct, 2018

场景坐标重建：通过增量学习重定位器进行图像集合的姿态估计

我们通过学习基于场景坐标回归的重新定位方法实现了无特征匹配和高效优化的相机姿态估计，从而构建了隐式的神经场景表示。

Apr, 2024

HSCNet++：基于 Transformer 的分层场景坐标分类和回归用于视觉定位

本文提出了一种新的 Hierarchical Scene Coordinate 网络，可以在一个像素级的场景坐标的预测中，以逐层递进地方式执行粗到细的预测，这种新方法在单图像定位方面表现出较好的性能，并在 7-Scenes，12 Scenes，Cambridge Landmarks 数据集和室内场景数据集上创下了新的最佳表现。

May, 2023

将其上线：将场景坐标回归网络预测应用于在线 RGB-D 相机重定位

本研究提出了一种新的方法来利用在一个场景中训练的神经网络来预测另一个场景中的点，以实现相机在线定位，并在 7-Scenes 和 Cambridge Landmarks 数据集上实现了最先进的性能，运行时间低于 300 毫秒。

Jun, 2019

从姿态中隐式学习场景几何用于全局定位

通过利用少量的标签数据（即相机姿态），本文提出了一种学习方法，将这些标签与刚性对齐相结合，学习场景的三维几何表示，并将其用于估计相机的六自由度姿态，从而提高了定位的准确性。

Dec, 2023