融合新旧技术:基于几何引导不确定性的相机相对位姿学习
本文提出了一种基于深度学习的摄像机再定位方法,通过卷积神经网络检索相似的数据库图像,并预测查询图像与数据库图像之间的相对姿态,使用 RANSAC 算法进行相对平移估计,并使用第二个 RANSAC 方案将相对姿态融合;此外,作者提出了一个涵盖 5 种不同场景的挑战性室内定位数据集,并在标准的 7 Scenes 测试基准上对方法进行了评估,结果表明该方法适用于之前未见过的场景,并与其他基于 CNN 的最新方法相比效果优异。
Jul, 2017
本文提出了一种深度 CNN 模型,该模型能够同时解决 6 自由度绝对摄像机姿态和 2D-3D 对应关系,通过全局特征匹配模块和分类模块实现了对无先验知识的 2D-3D 对应关系的盲目 PnP 问题的有效解决。
Mar, 2020
本文提出 DirectionNet 模型,通过预测 5D 相对位姿空间上的离散分布来改进相机位姿回归,实现将相机姿态分解为 3D 方向向量并在球面上估算离散分布。我们从 Matterport3D 和 InteriorNet 构建的具有挑战性的综合和真实姿态估计数据集中评估了我们的模型,结果表明我们的方法比直接回归大大减少了误差。(Translation: This paper proposes DirectionNet model to improve camera pose regression by predicting a discrete distribution over the 5D relative pose space. DirectionNet factorizes relative camera pose to a set of 3D direction vectors and estimates the distribution on the sphere, resulting in a significant error reduction compared to direct regression methods, as evaluated on challenging synthetic and real pose estimation datasets constructed from Matterport3D and InteriorNet.)
Jun, 2021
本研究提出了一种基于姿态回归网络和图神经网络相结合的视觉重新定位方法,可在没有内参信息的情况下达到与绝对姿态回归网络相当的准确性,同时保持相对姿态回归模型的高测试速度和对非训练场景的适用性。
Apr, 2021
相机位姿估计的方法可以通过找到对应关系和解决基础矩阵的方式在大多数情况下提供高精度,而使用神经网络直接预测姿态的方法对于有限重叠的情况更加鲁棒,并能够推断出绝对平移尺度,但精度较低。我们展示了如何结合这两种方法的优点;我们的方法能够同时提供精确和稳健的结果,并准确推断出平移尺度。我们模型的核心是一个 Transformer,它通过学习平衡已解决和学习的姿态估计,并提供一个先验信息来指导求解器。全面的分析支持了我们的设计选择,并证明了我们的方法能够灵活适应各种特征提取器和对应估计器,在 Matterport3D、InteriorNet、StreetLearn 和 Map-free Relocalization 上展现了最先进的 6 自由度姿态估计性能。
Mar, 2024
论文探讨了使用几何学和场景重投影误差等新颖的损失函数进行深度学习相机位姿回归的方法,同时展示了该技术在不同数据集上比 SIFT 算法更好的性能。
Apr, 2017
从单个图像中估计相对于全局框架的六自由度相机姿态的问题,我们提出了一种利用相对空间和时间几何约束的新颖网络来引导定位的深度网络的训练方法。利用相邻相机帧和场景中时空距离较远的相机帧获得的空间和时间相对姿态约束,我们的方法能够学习到在只有少量或非常稀疏的地面真实 3D 坐标可用的情况下进行定位。我们在三个常见的视觉定位数据集上评估了我们的方法,并证明其优于其他直接姿态估计方法。
Dec, 2023
本文提出了一种使用相对位移回归来规范绝对位姿估计的新方法,采用递归融合神经网络来更好地整合绝对和相对估计姿态,实验结果表明这种方法比使用姿态图优化的方法更为有效。
Apr, 2023
我们提出了一种联合 3D 姿态和焦距估计方法,采用深度学习技术和几何算法,通过将焦距明确地估计和整合到 3D 姿态估计中来实现对野外物体类别的姿态和焦距估计,并在 Pix3D、Comp 和 Stanford 三个具有不同物体类别的具有挑战性的真实世界数据集上进行了详细的评估,结果在多个指标上明显优于现有方法。
Aug, 2019
本文提出了一种基于卷积神经网络的方法来估计两个相机之间的相对姿态,该方法采用来自两个相机的 RGB 图像作为输入,并直接输出相对旋转和平移。与 SURF、ORB 这些广泛使用的局部特征方法相比较,该方法采用端到端的方式训练,利用大规模分类数据集进行迁移学习,结果表明相对基准线有明显的改进。此外,本文还介绍了一种包含空间金字塔池化 (SPP) 层的网络结构变体,并证明进一步提高了性能。
Feb, 2017