FastPoseCNN:实时单目类别级姿态和尺寸估计框架
本文提出了一种新颖的流程,通过解耦 6D 姿态和尺寸估计,减轻了单目观察带来的尺度不精确对刚性变换的影响,并借助预训练的单目估计器获取局部几何信息,以便搜寻二维 - 三维对应关系,并利用基于类别级统计的独立分支直接恢复物体的度量尺度,最后倡导使用 RANSAC-P$n$P 算法鲁棒求解 6D 物体姿态。在合成和真实数据集上进行了大量实验证明,相对于先前最先进的基于 RGB 的方法,我们的方法在旋转准确性方面表现出更高的性能。
Sep, 2023
该研究提出了一种基于关键点的方法,通过一个 RGB 图像作为输入,对已知类别内的未知目标实例进行目录级别的物体位姿估计,采用单阶段神经网络,并在 Objectron 基准测试中表现出比现有方法更好的性能
Sep, 2021
本文提出了一种快速形状网络(FS-Net),用于从单眼 RGB-D 图像中实现类别级 6D 姿态和大小的估计,该网络具有高效的类别级特征提取方法和新颖的解耦式旋转机制,该方法在两个基准数据集上实验表明取得了最佳性能。
Mar, 2021
该论文提出了一种从单个 RGB 图像中估计物体连续 6-DoF 姿态的方法,该方法结合了经卷积网络预测的语义关键点和可变形的形状模型,同时采用了半自动数据生成技术来训练可学习组件,在实验中该方法达到了与现有技术相当的结果。
Apr, 2022
本文介绍了一种基于深度卷积神经网络的方法,能够通过对特定对象类的分类和姿态回归,从单个或多视图中准确地推断大量对象类的六自由度姿态,并通过 SE(3)的均匀镶嵌提高了鲁棒性。作者还提出了一种适用于单视角存在歧义的高效多视图框架,并在 YCB-Video、JHUScene-50 和 ObjectNet-3D 三个大规模基准测试中取得了优异的表现,与目前现有技术相比表现优秀。
Mar, 2018
该论文提出了一种单次操作的方法,可以在不需要多个阶段或检查多个假设的同时,在 RGB 图像中检测对象并预测其 6D 姿态。通过采用新的 CNN 架构和 PnP 算法,该方法可以以 50fps 的速度在 Titan X GPU 上运行,比其他最近的 CNN 方法具有更高的准确性和更适合实时处理。
Nov, 2017
本文提出了一种改进的方法来解决摄像机位姿估计问题,利用回归森林对场景中的关键点进行对应,采用几何方法评分并选择最有前途的假设,使用多个快速但不精确的重新定位器级联,调整参数以实现有效的性能,实现了重定位性能的显着提升。
Oct, 2018
本论文提出了一种基于单个视角的 RGB-D 观测对多目标 3D 重建、6D 姿态和大小估计的简单、高效、端到端的方法,并且基于 ShapeNet 和 NOCS 数据集进行了广泛实验,在新颖实际世界的目标实例 6D 姿态中获得了 12.6% 的绝对改进。
Mar, 2022
以 Single View Image 作为输入,本文提出一种基于 Dual Pose Network 的新方法来预测 6D 对象姿态(旋转、平移和大小),DualPoseNet 利用两个平行的姿态解码器在共享姿态编码器的基础上,对对象构成补充监督,加强对姿态的学习,同时在没有测试 CAD 模型的情况下使用隐式解码器进行精细化的姿态预测,得到了比现有方法更好的效果。
Mar, 2021
本文提出一种基于分割的 6D 姿态估计框架,使用关键点检测获取局部姿态预测,并根据置信度预测将这些姿态候选融合成可靠的 3D-to-2D 对应关系,从而在多个低纹理物体相互遮挡的情况下获得最优姿态估计,其采用简单且高效的架构实现实时性能。
Dec, 2018