NormNet: 堆叠场景中的 6D 姿态估计的比例归一化

Nov, 2023

NormNet: 堆叠场景中的 6D 姿态估计的比例归一化

NormNet: Scale Normalization for 6D Pose Estimation in Stacked Scenarios

En-Te Lin, Wei-Jie Lv, Ding-Tao Huang, Long Zeng

TL;DR基于规模不同的堆叠情景中的对象姿态估计，本文提出了一种新的 6DoF OPE 网络 (NormNet)。该网络利用点对点回归学习每个对象的规模，并通过语义分割和仿射变换将堆叠情景中的所有对象归一化到相同的尺度，并通过共享位姿估计器恢复它们的 6D 姿态。此外，我们引入了一种新的 Sim-to-Real 转换流程，结合样式转换和域随机化，提高了 NormNet 在真实数据上的性能，即使只使用合成数据进行训练。大量实验证明了该方法在公共基准和我们构建的 MultiScale 数据集上达到了最先进的性能。真实世界的实验证明了我们的方法能够稳健地估计处于不同尺度的对象的 6D 姿态。

Abstract

Existing object pose estimation (OPE) methods for stacked scenarios are not robust to changes in object scale. This paper proposes a new <

object pose estimation stacked scenarios scale 6dof ope network sim-to-real transfer pipeline

发现论文，激发创造

DSC-PoseNet: 双尺度一致性学习 6DoF 目标位姿估计

本文基于 2D 物体注释和 RGB 图像提出了一个双步骤的姿态估计框架，该框架使用 DSC-PoseNet 网络实现了基于差分渲染器的姿态估计，同时还利用自我监督学习生成伪标签进行训练，实验表明该方法在真实数据集上性能优于基于合成数据集的现有模型。

Apr, 2021

单帧 6D 物体姿态估计

本文介绍了一种新的基于深度图像的单镜头 6D 物体姿态估计方法，使用全卷积神经网络实现，通过将三维输入数据在空间上离散化，将姿态估计视为一个回归任务来处理，在所得到的体元上局部求解。该方法是端对端优化的，不需要手动标注 6D 姿态的真实世界数据，依靠完全使用合成数据进行训练的方式得到了良好的性能。实验验证了该方法在公共基准数据集上的优异表现。

Apr, 2020

基于标准化目标坐标空间的分类别 6D 目标位姿和大小估计

本文旨在估计 RGB-D 图像中看不见的物体实例的 6D 姿态和尺寸，通过引入归一化对象坐标空间 (NOCS) 及基于区域的神经网络，结合大量混合现实数据来训练模型，最终能够在真实环境中以鲁棒的方式估计看不见的物体实例的姿态和大小，并在标准 6D 姿态估计基准上实现业内领先水平。

Jan, 2019

基于分割的 6D 物体姿态估计

本文提出一种基于分割的 6D 姿态估计框架，使用关键点检测获取局部姿态预测，并根据置信度预测将这些姿态候选融合成可靠的 3D-to-2D 对应关系，从而在多个低纹理物体相互遮挡的情况下获得最优姿态估计，其采用简单且高效的架构实现实时性能。

Dec, 2018

Omni6DPose：一种用于普适 6D 物体姿态估计和跟踪的基准和模型

6D 目标姿态估计是计算机视觉中一个重要且具有挑战性的任务，本文介绍了 Omni6DPose 数据集以及使用 GenPose++ 方法对其进行的基准分析。

Jun, 2024

DualPoseNet：利用双姿态网络和姿态一致性精调学习的类别级别 6D 物体姿态和大小估计

以 Single View Image 作为输入，本文提出一种基于 Dual Pose Network 的新方法来预测 6D 对象姿态（旋转、平移和大小），DualPoseNet 利用两个平行的姿态解码器在共享姿态编码器的基础上，对对象构成补充监督，加强对姿态的学习，同时在没有测试 CAD 模型的情况下使用隐式解码器进行精细化的姿态预测，得到了比现有方法更好的效果。

Mar, 2021

FS-Net：一种快速的基于形状的网络，用于解耦旋转机制的类别级 6D 物体姿态估计

本文提出了一种快速形状网络（FS-Net），用于从单眼 RGB-D 图像中实现类别级 6D 姿态和大小的估计，该网络具有高效的类别级特征提取方法和新颖的解耦式旋转机制，该方法在两个基准数据集上实验表明取得了最佳性能。

Mar, 2021

空间中的宽度 - 深度范围 6D 物体姿态估计

本论文提出了一种单阶段的分层端对端可训练网络，可以更好地解决大规模空间场景中的 6D 姿态估计问题，相比现有方法在合成的太空图像和标准数据集上表现更优秀。关键词包括 6D 姿态估计、空间、大气散射、基准数据集和端对端可训练网络

Apr, 2021

类别级别度量尺度物体形状和姿态估计

本文提出了一种框架，该框架可从一张单独的 RGB 图像中联合估计度量尺度形状和姿态，包括度量尺度物体形状分支（MSOS）和归一化物体坐标空间分支（NOCS）等；通过验证方法评估了类别级别的物体姿态和形状。

Sep, 2021

朝着更好的泛化：无需使用 PoseNet 的联合深度和姿态学习

通过解决自监督联合深度姿态学习中的比例不一致问题，我们提出了一种新颖的系统，利用了三角化模块来恢复比例到三维结构，并使用变换后的深度图对深度误差进行计算和复制 Projection Check 。

Apr, 2020