FastPoseCNN：实时单目类别级姿态和尺寸估计框架

Jun, 2024

FastPoseCNN：实时单目类别级姿态和尺寸估计框架

FastPoseCNN: Real-Time Monocular Category-Level Pose and Size Estimation Framework

Eduardo Davalos, Mehran Aminian

TL;DR该研究论文的主要目标是开发一个在实时中给出单一 RGB 图像的看不见物体的姿态和尺寸估计框架。

Abstract

The primary focus of this paper is the development of a framework for pose and size estimation of unseen objects given a single rgb image - all in →

pose and size estimation unseen objects rgb image real-time efficiency

发现论文，激发创造

基于 RGB 的类别级物体姿态估计与解耦的度量尺度恢复

本文提出了一种新颖的流程，通过解耦 6D 姿态和尺寸估计，减轻了单目观察带来的尺度不精确对刚性变换的影响，并借助预训练的单目估计器获取局部几何信息，以便搜寻二维 - 三维对应关系，并利用基于类别级统计的独立分支直接恢复物体的度量尺度，最后倡导使用 RANSAC-P$n$P 算法鲁棒求解 6D 物体姿态。在合成和真实数据集上进行了大量实验证明，相对于先前最先进的基于 RGB 的方法，我们的方法在旋转准确性方面表现出更高的性能。

Sep, 2023

基于关键点的单阶段类别级别物体姿态估计

该研究提出了一种基于关键点的方法，通过一个 RGB 图像作为输入，对已知类别内的未知目标实例进行目录级别的物体位姿估计，采用单阶段神经网络，并在 Objectron 基准测试中表现出比现有方法更好的性能

Sep, 2021

FS-Net：一种快速的基于形状的网络，用于解耦旋转机制的类别级 6D 物体姿态估计

本文提出了一种快速形状网络（FS-Net），用于从单眼 RGB-D 图像中实现类别级 6D 姿态和大小的估计，该网络具有高效的类别级特征提取方法和新颖的解耦式旋转机制，该方法在两个基准数据集上实验表明取得了最佳性能。

Mar, 2021

单幅 RGB 帧的基于语义关键点的姿态估算

该论文提出了一种从单个 RGB 图像中估计物体连续 6-DoF 姿态的方法，该方法结合了经卷积网络预测的语义关键点和可变形的形状模型，同时采用了半自动数据生成技术来训练可学习组件，在实验中该方法达到了与现有技术相当的结果。

Apr, 2022

多视角多类别物体姿态估计的统一框架

本文介绍了一种基于深度卷积神经网络的方法，能够通过对特定对象类的分类和姿态回归，从单个或多视图中准确地推断大量对象类的六自由度姿态，并通过 SE（3）的均匀镶嵌提高了鲁棒性。作者还提出了一种适用于单视角存在歧义的高效多视图框架，并在 YCB-Video、JHUScene-50 和 ObjectNet-3D 三个大规模基准测试中取得了优异的表现，与目前现有技术相比表现优秀。

Mar, 2018

实时无缝单帧六维物体姿态预测

该论文提出了一种单次操作的方法，可以在不需要多个阶段或检查多个假设的同时，在 RGB 图像中检测对象并预测其 6D 姿态。通过采用新的 CNN 架构和 PnP 算法，该方法可以以 50fps 的速度在 Titan X GPU 上运行，比其他最近的 CNN 方法具有更高的准确性和更适合实时处理。

Nov, 2017

使用重新本地化级联实时估计新场景中的 RGB-D 摄像机姿态

本文提出了一种改进的方法来解决摄像机位姿估计问题，利用回归森林对场景中的关键点进行对应，采用几何方法评分并选择最有前途的假设，使用多个快速但不精确的重新定位器级联，调整参数以实现有效的性能，实现了重定位性能的显着提升。

Oct, 2018

CenterSnap: 单次拍摄多目标三维形状重建及分类六自由度姿态与大小估计

本论文提出了一种基于单个视角的 RGB-D 观测对多目标 3D 重建、6D 姿态和大小估计的简单、高效、端到端的方法，并且基于 ShapeNet 和 NOCS 数据集进行了广泛实验，在新颖实际世界的目标实例 6D 姿态中获得了 12.6% 的绝对改进。

Mar, 2022

DualPoseNet：利用双姿态网络和姿态一致性精调学习的类别级别 6D 物体姿态和大小估计

以 Single View Image 作为输入，本文提出一种基于 Dual Pose Network 的新方法来预测 6D 对象姿态（旋转、平移和大小），DualPoseNet 利用两个平行的姿态解码器在共享姿态编码器的基础上，对对象构成补充监督，加强对姿态的学习，同时在没有测试 CAD 模型的情况下使用隐式解码器进行精细化的姿态预测，得到了比现有方法更好的效果。

Mar, 2021

基于分割的 6D 物体姿态估计

本文提出一种基于分割的 6D 姿态估计框架，使用关键点检测获取局部姿态预测，并根据置信度预测将这些姿态候选融合成可靠的 3D-to-2D 对应关系，从而在多个低纹理物体相互遮挡的情况下获得最优姿态估计，其采用简单且高效的架构实现实时性能。

Dec, 2018