PoseCNN: 一种用于混杂场景下六维物体姿态估计的卷积神经网络
该研究介绍了 ConvPoseCNN,它是一种全卷积架构,能够实现对象位姿的像素级密集预测,包括翻译和方向组件,其中密集方向以四元数形式表示,并使用不同方法对密集方向预测进行聚合,该方法与比较方法相比具有更少的参数和更快的训练速度,而且能够自动学习信任、无遮挡和特征丰富的对象区域。
Dec, 2019
本文介绍了一种基于深度卷积神经网络的方法,能够通过对特定对象类的分类和姿态回归,从单个或多视图中准确地推断大量对象类的六自由度姿态,并通过 SE(3)的均匀镶嵌提高了鲁棒性。作者还提出了一种适用于单视角存在歧义的高效多视图框架,并在 YCB-Video、JHUScene-50 和 ObjectNet-3D 三个大规模基准测试中取得了优异的表现,与目前现有技术相比表现优秀。
Mar, 2018
使用无监督学习的方法进行单眼 RGB 数据下的 6D 物体位姿估计,作者训练了一个神经网络模型,通过真实 RGB-D 数据的自监督模式来提高模型的性能表现,并证明了该方法能够显著地优化模型的性能,超过了其他使用合成数据或领域适应技术的方法。
Apr, 2020
本文介绍了一种新的基于深度图像的单镜头 6D 物体姿态估计方法,使用全卷积神经网络实现,通过将三维输入数据在空间上离散化,将姿态估计视为一个回归任务来处理,在所得到的体元上局部求解。该方法是端对端优化的,不需要手动标注 6D 姿态的真实世界数据,依靠完全使用合成数据进行训练的方式得到了良好的性能。实验验证了该方法在公共基准数据集上的优异表现。
Apr, 2020
研究使用卷积神经网络 (CNNs) 和传递学习 (transfer learning) 进行 6 自由度 (6-DoF) 相机位姿估计,通过对数据集特征的研究改进 PoseNet 性能,尤其强调视野对图像分辨率的重要性,给出数据增强方案以减少过拟合,对 LSTM 单元的效果进行了研究,并最终结合这些修改方案优化了单目 CNN 相机姿态估计的性能。
Sep, 2019
该研究通过 CNN 回归框架提出了适当的表示、数据增强和损失函数来捕捉姿态空间的几何信息,将 3D 姿态估计问题转化为回归问题,并在 PASCAL3D + 数据集上得到与同类最优方法相当的性能表现。
Aug, 2017
本研究探讨了卷积神经网络在处理单目视觉下 3D 人体姿态感知任务方面的能力,通过将时间维度编码在卷积空间中的第三个维度,直接回归到 3D 坐标空间中的人体关节位置,从而在选定的 Human3.6M 数据集上展示了该网络达到了最先进的性能。
Aug, 2016
该论文提出了一种单次操作的方法,可以在不需要多个阶段或检查多个假设的同时,在 RGB 图像中检测对象并预测其 6D 姿态。通过采用新的 CNN 架构和 PnP 算法,该方法可以以 50fps 的速度在 Titan X GPU 上运行,比其他最近的 CNN 方法具有更高的准确性和更适合实时处理。
Nov, 2017
该研究旨在使用卷积神经网络检测和定位 RGB-D 场景中的物体,然后使用 3D 模型替换它们,相对于目前最先进的算法,该方法在 3D 检测任务中表现出 48%的相对改进,并且速度更快。
Feb, 2015