融合新旧技术：基于几何引导不确定性的相机相对位姿学习

CVPRApr, 2021

融合新旧技术：基于几何引导不确定性的相机相对位姿学习

Fusing the Old with the New: Learning Relative Camera Pose with Geometry-Guided Uncertainty

Bingbing Zhuang, Manmohan Chandraker

TL;DR本研究提出了一种新的框架，涉及到两个预测模型之间的概率融合，旨在利用它们的互补优点进行可学习的融合，并使用自我注意图神经网络来驱动学习，通过显式地指导几何不确定性学习 DNN 的不确定性，从而学习相对于 DNN 预测的几何解决方案。该方法达到了 DeMoN 和 ScanNet 数据集上最先进的性能表现。

Abstract

Learning methods for relative camera pose estimation have been developed largely in isolation from classical geometric approaches. The question of how to integrate predictions from deep neural networks (DNNs) and solutions from →

relative camera pose estimation deep neural network geometric solvers probabilistic fusion self-attention graph neural network

发现论文，激发创造

使用卷积神经网络计算两两相对姿态实现摄像机重定位

本文提出了一种基于深度学习的摄像机再定位方法，通过卷积神经网络检索相似的数据库图像，并预测查询图像与数据库图像之间的相对姿态，使用 RANSAC 算法进行相对平移估计，并使用第二个 RANSAC 方案将相对姿态融合；此外，作者提出了一个涵盖 5 种不同场景的挑战性室内定位数据集，并在标准的 7 Scenes 测试基准上对方法进行了评估，结果表明该方法适用于之前未见过的场景，并与其他基于 CNN 的最新方法相比效果优异。

Jul, 2017

学习 2D-3D 对应关系以解决盲目透视 n 点问题

本文提出了一种深度 CNN 模型，该模型能够同时解决 6 自由度绝对摄像机姿态和 2D-3D 对应关系，通过全局特征匹配模块和分类模块实现了对无先验知识的 2D-3D 对应关系的盲目 PnP 问题的有效解决。

Mar, 2020

具方向性学习的宽基线相对相机位姿估计

本文提出 DirectionNet 模型，通过预测 5D 相对位姿空间上的离散分布来改进相机位姿回归，实现将相机姿态分解为 3D 方向向量并在球面上估算离散分布。我们从 Matterport3D 和 InteriorNet 构建的具有挑战性的综合和真实姿态估计数据集中评估了我们的模型，结果表明我们的方法比直接回归大大减少了误差。(Translation: This paper proposes DirectionNet model to improve camera pose regression by predicting a discrete distribution over the 5D relative pose space. DirectionNet factorizes relative camera pose to a set of 3D direction vectors and estimates the distribution on the sphere, resulting in a significant error reduction compared to direct regression methods, as evaluated on challenging synthetic and real pose estimation datasets constructed from Matterport3D and InteriorNet.)

Jun, 2021

使用图神经网络和相对姿态监督的视觉相机定位

本研究提出了一种基于姿态回归网络和图神经网络相结合的视觉重新定位方法，可在没有内参信息的情况下达到与绝对姿态回归网络相当的准确性，同时保持相对姿态回归模型的高测试速度和对非训练场景的适用性。

Apr, 2021

FAR：灵活、准确和稳健的 6DoF 相机相对姿态估计

相机位姿估计的方法可以通过找到对应关系和解决基础矩阵的方式在大多数情况下提供高精度，而使用神经网络直接预测姿态的方法对于有限重叠的情况更加鲁棒，并能够推断出绝对平移尺度，但精度较低。我们展示了如何结合这两种方法的优点；我们的方法能够同时提供精确和稳健的结果，并准确推断出平移尺度。我们模型的核心是一个 Transformer，它通过学习平衡已解决和学习的姿态估计，并提供一个先验信息来指导求解器。全面的分析支持了我们的设计选择，并证明了我们的方法能够灵活适应各种特征提取器和对应估计器，在 Matterport3D、InteriorNet、StreetLearn 和 Map-free Relocalization 上展现了最先进的 6 自由度姿态估计性能。

Mar, 2024

使用深度学习进行相机姿态回归的几何损失函数

论文探讨了使用几何学和场景重投影误差等新颖的损失函数进行深度学习相机位姿回归的方法，同时展示了该技术在不同数据集上比 SIFT 算法更好的性能。

Apr, 2017

全球定位：利用相邻和远源相机的相对时空几何约束

从单个图像中估计相对于全局框架的六自由度相机姿态的问题，我们提出了一种利用相对空间和时间几何约束的新颖网络来引导定位的深度网络的训练方法。利用相邻相机帧和场景中时空距离较远的相机帧获得的空间和时间相对姿态约束，我们的方法能够学习到在只有少量或非常稀疏的地面真实 3D 坐标可用的情况下进行定位。我们在三个常见的视觉定位数据集上评估了我们的方法，并证明其优于其他直接姿态估计方法。

Dec, 2023

融合来自运动结构和光流模拟姿势回归的算法用于具有挑战性室内环境

本文提出了一种使用相对位移回归来规范绝对位姿估计的新方法，采用递归融合神经网络来更好地整合绝对和相对估计姿态，实验结果表明这种方法比使用姿态图优化的方法更为有效。

Apr, 2023

GP2C：约束几何投影参数的一致性以估计关节 3D 姿势和在野外的焦距

我们提出了一种联合 3D 姿态和焦距估计方法，采用深度学习技术和几何算法，通过将焦距明确地估计和整合到 3D 姿态估计中来实现对野外物体类别的姿态和焦距估计，并在 Pix3D、Comp 和 Stanford 三个具有不同物体类别的具有挑战性的真实世界数据集上进行了详细的评估，结果在多个指标上明显优于现有方法。

Aug, 2019

卷积神经网络相对摄像机位姿估计

本文提出了一种基于卷积神经网络的方法来估计两个相机之间的相对姿态，该方法采用来自两个相机的 RGB 图像作为输入，并直接输出相对旋转和平移。与 SURF、ORB 这些广泛使用的局部特征方法相比较，该方法采用端到端的方式训练，利用大规模分类数据集进行迁移学习，结果表明相对基准线有明显的改进。此外，本文还介绍了一种包含空间金字塔池化 (SPP) 层的网络结构变体，并证明进一步提高了性能。

Feb, 2017