单阶段 6D 物体位姿估计

CVPRNov, 2019

Single-Stage 6D Object Pose Estimation

Yinlin Hu, Pascal Fua, Wei Wang, Mathieu Salzmann

TL;DR本文介绍了一种基于深度学习的 6D 姿态估计架构，能够直接从对应点回归 6D 姿态，并提出了单阶段 6D 姿态估计框架，能够在准确性和速度方面显著优于现有的双阶段框架。

Abstract

Most recent 6d pose estimation frameworks first rely on a deep network to establish correspondences between 3D object keypoints and 2D ima

6d pose estimation deep network correspondences single-stage frameworks accuracy

发现论文，激发创造

基于分割的 6D 物体姿态估计

本文提出一种基于分割的 6D 姿态估计框架，使用关键点检测获取局部姿态预测，并根据置信度预测将这些姿态候选融合成可靠的 3D-to-2D 对应关系，从而在多个低纹理物体相互遮挡的情况下获得最优姿态估计，其采用简单且高效的架构实现实时性能。

Dec, 2018

单帧 6D 物体姿态估计

本文介绍了一种新的基于深度图像的单镜头 6D 物体姿态估计方法，使用全卷积神经网络实现，通过将三维输入数据在空间上离散化，将姿态估计视为一个回归任务来处理，在所得到的体元上局部求解。该方法是端对端优化的，不需要手动标注 6D 姿态的真实世界数据，依靠完全使用合成数据进行训练的方式得到了良好的性能。实验验证了该方法在公共基准数据集上的优异表现。

Apr, 2020

透视流聚合用于数据受限的 6D 物体姿态估计

本文提出了一种基于合成图像或少量真实图像训练的 6D 物体位姿估计方法，使用第一网络获得粗略姿态估计后，使用第二网络预测精细的二维对应场，并推断所需的姿态纠正，该方法在显著减少合成图像与真实图像领域差异的情况下具有与需要标注真实图像训练的方法相当的性能，而在使用 20 张真实图像时，它的性能明显优于它们。

Mar, 2022

Deep-6DPose：从单个 RGB 图像中恢复 6D 物体姿态

本文介绍了一种名为 Deep-6DPose 的端到端深度学习框架，可以从单个 RGB 图像中同时检测、分割并恢复目标实例的 6D 姿态。实验表明，Deep-6DPose 比目前基于 RGB 的多阶段姿态估计方法更快，并且在标准的姿态基准数据集上显示出与现有方法相当的好的效果。

Feb, 2018

实时无缝单帧六维物体姿态预测

该论文提出了一种单次操作的方法，可以在不需要多个阶段或检查多个假设的同时，在 RGB 图像中检测对象并预测其 6D 姿态。通过采用新的 CNN 架构和 PnP 算法，该方法可以以 50fps 的速度在 Titan X GPU 上运行，比其他最近的 CNN 方法具有更高的准确性和更适合实时处理。

Nov, 2017

6D 多目标姿态估计的耦合迭代优化

提出了一种基于几何知识的端到端可微建构的方法，通过 BD-PnP 优化问题迭代地细化姿态估计和对应关系，并动态地删除离群值以提高准确性，从而在标准的 6D 物体姿态基准测试上实现了最新的准确性。

Apr, 2022

学习 2D-3D 对应关系以解决盲目透视 n 点问题

本文提出了一种深度 CNN 模型，该模型能够同时解决 6 自由度绝对摄像机姿态和 2D-3D 对应关系，通过全局特征匹配模块和分类模块实现了对无先验知识的 2D-3D 对应关系的盲目 PnP 问题的有效解决。

Mar, 2020

空间中的宽度 - 深度范围 6D 物体姿态估计

本论文提出了一种单阶段的分层端对端可训练网络，可以更好地解决大规模空间场景中的 6D 姿态估计问题，相比现有方法在合成的太空图像和标准数据集上表现更优秀。关键词包括 6D 姿态估计、空间、大气散射、基准数据集和端对端可训练网络

Apr, 2021

基于语义关键点的六自由度物体位姿估计

本文提出了一种新的方法，使用卷积网络 (ConvNet) 预测语义关键点结合可变形形状模型，从单张 RGB 图像中估计物体的连续六自由度 (6-DoF) 姿态 (三维平移和旋转)，可以应用于基于实例和类别的姿态恢复，且无论是纹理还是无纹理对象均可。实验结果表明，该方法可在杂乱背景下准确地恢复实例和类别物体的 6-DoF 姿态，并在大规模 PASCAL3D+ 数据集上显示出最先进的精度。

Mar, 2017

多视角多类别物体姿态估计的统一框架

本文介绍了一种基于深度卷积神经网络的方法，能够通过对特定对象类的分类和姿态回归，从单个或多视图中准确地推断大量对象类的六自由度姿态，并通过 SE（3）的均匀镶嵌提高了鲁棒性。作者还提出了一种适用于单视角存在歧义的高效多视图框架，并在 YCB-Video、JHUScene-50 和 ObjectNet-3D 三个大规模基准测试中取得了优异的表现，与目前现有技术相比表现优秀。

Mar, 2018