PoseCNN: 一种用于混杂场景下六维物体姿态估计的卷积神经网络

Nov, 2017

PoseCNN: 一种用于混杂场景下六维物体姿态估计的卷积神经网络

PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes

Yu Xiang, Tanner Schmidt, Venkatraman Narayanan, Dieter Fox

TL;DR该论文介绍了一种新的卷积神经网络，PoseCNN，可用于解决机器人与真实世界互动时的 6D 目标位姿估算问题，并提供了解决对称物体的新型损失函数和一个大型视频数据集。

Abstract

Estimating the 6D pose of known objects is important for robots to interact with the real world. The problem is challenging due to the variety of objects as well as the complexity of a scene caused by clutter and occlusions between objects. In this work, we introduce PoseCNN, a new

6d pose estimation convolutional neural network symmetric objects video dataset occlusions

发现论文，激发创造

ConvPoseCNN: 密集卷积 6D 物体姿态估计

该研究介绍了 ConvPoseCNN，它是一种全卷积架构，能够实现对象位姿的像素级密集预测，包括翻译和方向组件，其中密集方向以四元数形式表示，并使用不同方法对密集方向预测进行聚合，该方法与比较方法相比具有更少的参数和更快的训练速度，而且能够自动学习信任、无遮挡和特征丰富的对象区域。

Dec, 2019

多视角多类别物体姿态估计的统一框架

本文介绍了一种基于深度卷积神经网络的方法，能够通过对特定对象类的分类和姿态回归，从单个或多视图中准确地推断大量对象类的六自由度姿态，并通过 SE（3）的均匀镶嵌提高了鲁棒性。作者还提出了一种适用于单视角存在歧义的高效多视图框架，并在 YCB-Video、JHUScene-50 和 ObjectNet-3D 三个大规模基准测试中取得了优异的表现，与目前现有技术相比表现优秀。

Mar, 2018

Self6D: 自监督单目 6D 物体姿态估计

使用无监督学习的方法进行单眼 RGB 数据下的 6D 物体位姿估计，作者训练了一个神经网络模型，通过真实 RGB-D 数据的自监督模式来提高模型的性能表现，并证明了该方法能够显著地优化模型的性能，超过了其他使用合成数据或领域适应技术的方法。

Apr, 2020

单帧 6D 物体姿态估计

本文介绍了一种新的基于深度图像的单镜头 6D 物体姿态估计方法，使用全卷积神经网络实现，通过将三维输入数据在空间上离散化，将姿态估计视为一个回归任务来处理，在所得到的体元上局部求解。该方法是端对端优化的，不需要手动标注 6D 姿态的真实世界数据，依靠完全使用合成数据进行训练的方式得到了良好的性能。实验验证了该方法在公共基准数据集上的优异表现。

Apr, 2020

如何提高基于卷积神经网络的六自由度相机姿态估计

研究使用卷积神经网络 (CNNs) 和传递学习 (transfer learning) 进行 6 自由度 (6-DoF) 相机位姿估计，通过对数据集特征的研究改进 PoseNet 性能，尤其强调视野对图像分辨率的重要性，给出数据增强方案以减少过拟合，对 LSTM 单元的效果进行了研究，并最终结合这些修改方案优化了单目 CNN 相机姿态估计的性能。

Sep, 2019

使用卷积神经网络进行 3D 姿态回归

该研究通过 CNN 回归框架提出了适当的表示、数据增强和损失函数来捕捉姿态空间的几何信息，将 3D 姿态估计问题转化为回归问题，并在 PASCAL3D + 数据集上得到与同类最优方法相当的性能表现。

Aug, 2017

PoseNet：一种用于实时六自由度相机重定位的卷积网络

本文提出了一个稳健而实时的单目六自由度重定位系统，使用卷积神经网络训练完成，无需其他工程或优化过程。

May, 2015

使用三维卷积神经网络实现时空人体姿态估计

本研究探讨了卷积神经网络在处理单目视觉下 3D 人体姿态感知任务方面的能力，通过将时间维度编码在卷积空间中的第三个维度，直接回归到 3D 坐标空间中的人体关节位置，从而在选定的 Human3.6M 数据集上展示了该网络达到了最先进的性能。

Aug, 2016

实时无缝单帧六维物体姿态预测

该论文提出了一种单次操作的方法，可以在不需要多个阶段或检查多个假设的同时，在 RGB 图像中检测对象并预测其 6D 姿态。通过采用新的 CNN 架构和 PnP 算法，该方法可以以 50fps 的速度在 Titan X GPU 上运行，比其他最近的 CNN 方法具有更高的准确性和更适合实时处理。

Nov, 2017

从 RGB-D 图像推断三维物体姿态

该研究旨在使用卷积神经网络检测和定位 RGB-D 场景中的物体，然后使用 3D 模型替换它们，相对于目前最先进的算法，该方法在 3D 检测任务中表现出 48％的相对改进，并且速度更快。

Feb, 2015