使用卷积神经网络进行 3D 姿态回归

Aug, 2017

使用卷积神经网络进行 3D 姿态回归

3D Pose Regression using Convolutional Neural Networks

Siddharth Mahendran, Haider Ali, Rene Vidal

TL;DR该研究通过 CNN 回归框架提出了适当的表示、数据增强和损失函数来捕捉姿态空间的几何信息，将 3D 姿态估计问题转化为回归问题，并在 PASCAL3D + 数据集上得到与同类最优方法相当的性能表现。

Abstract

3d pose estimation is a key component of many important computer vision tasks such as autonomous navigation and 3D scene understanding. Most state-of-the-art approaches to →

3d pose estimation computer vision cnn regression geometry pascal3d+

发现论文，激发创造

从 2D 图像中估计三维姿态的混合分类回归框架

本文提出了一种混合分类 - 回归框架，用于解决计算机视觉中单个 2D 图像中的 3D 姿态估计问题，该方法能够捕捉多模态姿态分布，通过使用分类网络产生离散多模态姿态估计和回归网络产生连续的优化结果，实现了多个分类 - 回归模型，其中一些在具有挑战性的 Pascal3D + 数据集上达到了最新水平的性能表现。

May, 2018

使用带有 2D 姿态信息的卷积神经网络进行 3D 人体姿势估计

本文提出了一种使用卷积神经网络进行端到端学习的 3D 人体姿势估计方法，通过 CNN 学习找出相对于其他关节的相对 3D 位置，并通过将 2D 姿势信息与图像特征连接以及通过关于多个关节的相对位置信息的组合来获得更准确的 3D 姿势。实验结果表明，该方法在 Human 3.6m 数据集上实现了与最先进方法可比较的性能。

Aug, 2016

使用三维卷积神经网络实现时空人体姿态估计

本研究探讨了卷积神经网络在处理单目视觉下 3D 人体姿态感知任务方面的能力，通过将时间维度编码在卷积空间中的第三个维度，直接回归到 3D 坐标空间中的人体关节位置，从而在选定的 Human3.6M 数据集上展示了该网络达到了最先进的性能。

Aug, 2016

PoseCNN: 一种用于混杂场景下六维物体姿态估计的卷积神经网络

该论文介绍了一种新的卷积神经网络，PoseCNN，可用于解决机器人与真实世界互动时的 6D 目标位姿估算问题，并提供了解决对称物体的新型损失函数和一个大型视频数据集。

Nov, 2017

使用深度神经网络进行 3D 人体姿态结构预测

本文提出了一种基于深度学习回归体系结构的 3D 人体姿势结构预测方法，该方法借助于过度完备的自动编码器并考虑关节从属关系，优于现有技术，包括结构保留和预测准确性两方面。

May, 2016

深度学习相机姿态估计介绍

本文概述了深度学习在计算机视觉领域中对相机姿态估计的应用，描述了关键方法和趋势，对现有的学习为基础的姿态估计器进行了广泛的交叉比较，并讨论了新出现的解决方案和未来的研究方向。

Jul, 2019

具有高效中层特征提取的连体回归网络，用于三维物体姿态估计

本文提出了一种基于 Siamese Networks 的、直接回归物体姿态的端到端学习框架，利用我们的姿态引导特征学习，在三维姿态估计领域中取得了更好的性能表现。该学习框架还具备在严重遮挡下仍可进行学习的能力，并在新颖的手 - 物体数据集上表现出高性能。

Jul, 2016

基于 CNN 的绝对相机姿态回归的局限性理解

本研究旨在解决场景中精确的相机姿态估计的视觉定位问题，传统方法使用 3D 几何学，而新近出现的卷积神经网络则直接从输入图像中学习相机姿态，但是并未达到 3D 方法的精度。本论文提出了一种理论模型来预测 pose regression 技术的失败案例，并证实了我们的预测。作者进一步表明，pose regression 与图像检索非常相似，而不是与 3D 结构的准确姿态估计。最重要的是，当前方法并不能持续超越手工图像检索基线，因此需要进一步的研究。

Mar, 2019

从 RGB-D 图像推断三维物体姿态

该研究旨在使用卷积神经网络检测和定位 RGB-D 场景中的物体，然后使用 3D 模型替换它们，相对于目前最先进的算法，该方法在 3D 检测任务中表现出 48％的相对改进，并且速度更快。

Feb, 2015

当回归遇上流形学习：物体识别和姿态估计

本文提出一种通过卷积神经网络从深度图像中识别物体和估计姿态的方法，采用流形学习和姿态回归的多任务学习框架，通过实验证明，所提出的新型损失函数大大提高了网络学习到的视角描述符的区分度，相对姿态准确性比相关工作提高了近 30％。

May, 2018