快速单次拍摄检测与姿态估计

Sep, 2016

Fast Single Shot Detection and Pose Estimation

Patrick Poirson, Phil Ammirato, Cheng-Yang Fu, Wei Liu, Jana Kosecka...

TL;DR该研究提出了一种多用途的卷积神经网络方法，该方法能够在单次识别中实现物体检测和粗略姿态估计，可以作为高精度姿态估计、物体跟踪和定位以及 vSLAM 等任务的预处理步骤。

Abstract

For applications in navigation and robotics, estimating the 3D pose of objects is as important as detection. Many approaches to pose estimation rely on detecting or tracking parts or keypoints [11, 21]. In this p

pose estimation object detection deep learning convolutional network robotics

发现论文，激发创造

实时无缝单帧六维物体姿态预测

该论文提出了一种单次操作的方法，可以在不需要多个阶段或检查多个假设的同时，在 RGB 图像中检测对象并预测其 6D 姿态。通过采用新的 CNN 架构和 PnP 算法，该方法可以以 50fps 的速度在 Titan X GPU 上运行，比其他最近的 CNN 方法具有更高的准确性和更适合实时处理。

Nov, 2017

单帧 6D 物体姿态估计

本文介绍了一种新的基于深度图像的单镜头 6D 物体姿态估计方法，使用全卷积神经网络实现，通过将三维输入数据在空间上离散化，将姿态估计视为一个回归任务来处理，在所得到的体元上局部求解。该方法是端对端优化的，不需要手动标注 6D 姿态的真实世界数据，依靠完全使用合成数据进行训练的方式得到了良好的性能。实验验证了该方法在公共基准数据集上的优异表现。

Apr, 2020

卷积神经网络实现高效的物体定位

通过深度卷积网络及位置细化模型使人体姿态的关节定位精度得到提升

Nov, 2014

单幅 RGB 帧的基于语义关键点的姿态估算

该论文提出了一种从单个 RGB 图像中估计物体连续 6-DoF 姿态的方法，该方法结合了经卷积网络预测的语义关键点和可变形的形状模型，同时采用了半自动数据生成技术来训练可学习组件，在实验中该方法达到了与现有技术相当的结果。

Apr, 2022

使用深度学习和几何学进行 3D 边界框估计

本文提出了一种使用单张图片进行三维目标检测与姿态估计的方法，通过使用深度卷积神经网络来回归相对稳定的三维目标属性，并使用二维边界框提供的几何约束来组合这些估计，从而产生完整的三维边界框。

Dec, 2016

卷积模型用于联合物体分类和姿态估计

本文探讨了深度学习方法在物体识别和姿态估计方面的应用，发现卷积神经网络（CNN）可以同时进行物体分类和姿态估计，并在两个大型多视点数据集上实现了优于最先进方法的表现。

Nov, 2015

ConvPoseCNN: 密集卷积 6D 物体姿态估计

该研究介绍了 ConvPoseCNN，它是一种全卷积架构，能够实现对象位姿的像素级密集预测，包括翻译和方向组件，其中密集方向以四元数形式表示，并使用不同方法对密集方向预测进行聚合，该方法与比较方法相比具有更少的参数和更快的训练速度，而且能够自动学习信任、无遮挡和特征丰富的对象区域。

Dec, 2019

OnePose：无 CAD 模型一次性物体姿态估计

本文提出了一种名为 OnePose 的新方法，可以在没有 CAD 模型的情况下对任意类别的物体进行物体姿态估计，利用视觉定位和图形注意力网络结合进行 2D 和 3D 特征匹配，结合基于特征的姿势跟踪器，可以实现对日常家用物品 6D 姿态的实时稳定检测和跟踪。

May, 2022

基于分割的 6D 物体姿态估计

本文提出一种基于分割的 6D 姿态估计框架，使用关键点检测获取局部姿态预测，并根据置信度预测将这些姿态候选融合成可靠的 3D-to-2D 对应关系，从而在多个低纹理物体相互遮挡的情况下获得最优姿态估计，其采用简单且高效的架构实现实时性能。

Dec, 2018

视频中高效姿态估计的检测与追踪

该论文提出了一种基于最新的人体检测和视频理解技术的轻量化人体关键点估计和跟踪方法，在帧级别和短视频片段中进行关键点估计，并进行轻量级跟踪，领先于多项竞争者，成为 2017 年 ICCV PoseTrack 的关键点跟踪挑战的最佳表现。

Dec, 2017