RPNet:一种端到端的相机姿态相对定位网络
本文提出了一种基于卷积神经网络的方法来估计两个相机之间的相对姿态,该方法采用来自两个相机的 RGB 图像作为输入,并直接输出相对旋转和平移。与 SURF、ORB 这些广泛使用的局部特征方法相比较,该方法采用端到端的方式训练,利用大规模分类数据集进行迁移学习,结果表明相对基准线有明显的改进。此外,本文还介绍了一种包含空间金字塔池化 (SPP) 层的网络结构变体,并证明进一步提高了性能。
Feb, 2017
本文提出了一种基于深度学习的摄像机再定位方法,通过卷积神经网络检索相似的数据库图像,并预测查询图像与数据库图像之间的相对姿态,使用 RANSAC 算法进行相对平移估计,并使用第二个 RANSAC 方案将相对姿态融合;此外,作者提出了一个涵盖 5 种不同场景的挑战性室内定位数据集,并在标准的 7 Scenes 测试基准上对方法进行了评估,结果表明该方法适用于之前未见过的场景,并与其他基于 CNN 的最新方法相比效果优异。
Jul, 2017
本研究提出了一种基于姿态回归网络和图神经网络相结合的视觉重新定位方法,可在没有内参信息的情况下达到与绝对姿态回归网络相当的准确性,同时保持相对姿态回归模型的高测试速度和对非训练场景的适用性。
Apr, 2021
通过使用物体区域指导姿势估计问题,而不是显式语义物体检测,我们提出 Pose Refiner Network (PoserNet)—— 轻量级图神经网络来细化相机姿态的大致成对相对姿态。
Jul, 2022
本文提出了一种基于神经网络的新型三维人体姿态估计算法,采用关系网络的结构来捕捉不同身体部位之间的关系,并使用每对不同身体部位生成的特征的平均值进行 3D 姿态估计,提出的网络在 Human 3.6M 数据集中实现了最先进的性能,并能在缺失关节的情况下有效地产生可信的结果。
May, 2018
本文提出 DirectionNet 模型,通过预测 5D 相对位姿空间上的离散分布来改进相机位姿回归,实现将相机姿态分解为 3D 方向向量并在球面上估算离散分布。我们从 Matterport3D 和 InteriorNet 构建的具有挑战性的综合和真实姿态估计数据集中评估了我们的模型,结果表明我们的方法比直接回归大大减少了误差。(Translation: This paper proposes DirectionNet model to improve camera pose regression by predicting a discrete distribution over the 5D relative pose space. DirectionNet factorizes relative camera pose to a set of 3D direction vectors and estimates the distribution on the sphere, resulting in a significant error reduction compared to direct regression methods, as evaluated on challenging synthetic and real pose estimation datasets constructed from Matterport3D and InteriorNet.)
Jun, 2021
本文提出了一种基于像素准确度的向量回归方法来精确估计单个 RGB 图像中物体的 6 自由度位姿,并使用 RANSAC 通过向量投票来有效地处理遮挡和截断问题,该方法的实验证明在 LINEMOD,Occlusion LINEMOD 和 YCB-Video 数据集上优于现有的方法,并且具有实时检测的高效性。
Dec, 2018