基于柔性向量旋转表示的六维物体类别姿态估计
本文提出了一种新颖的流程,通过解耦 6D 姿态和尺寸估计,减轻了单目观察带来的尺度不精确对刚性变换的影响,并借助预训练的单目估计器获取局部几何信息,以便搜寻二维 - 三维对应关系,并利用基于类别级统计的独立分支直接恢复物体的度量尺度,最后倡导使用 RANSAC-P$n$P 算法鲁棒求解 6D 物体姿态。在合成和真实数据集上进行了大量实验证明,相对于先前最先进的基于 RGB 的方法,我们的方法在旋转准确性方面表现出更高的性能。
Sep, 2023
本文提出了一种快速形状网络(FS-Net),用于从单眼 RGB-D 图像中实现类别级 6D 姿态和大小的估计,该网络具有高效的类别级特征提取方法和新颖的解耦式旋转机制,该方法在两个基准数据集上实验表明取得了最佳性能。
Mar, 2021
本文提出了 6D-ViT,这是一种基于变压器的实例表示学习网络,可用于对 RGB-D 图像进行高准确度的类别级对象姿态估计。通过使用来自 RGB 图像、点云和形状先验的复杂和强大的实例表示进行实验演示,该框架可显著提高现有方法的性能
Oct, 2021
我们提出了一种基于实时 RGB 的管道来实现物体检测和六自由度姿态估计。我们的创新性三维方向估计基于域随机化训练的三维模型的模拟视图,采用了变体的降噪自编码器。我们称之为增强自编码器相较于现有方法具有多个优点:它不需要真实标注的训练数据,适用于各种测试传感器,固有的处理物体和视角对称性。我们提出了一种隐式表征物体方向的方法,定义了潜在空间内的样本,而不是学习从输入图像到对象姿态的显式映射。我们的管道在 T-LESS 数据集的 RGB 和 RGB-D 领域均取得了最新成果。我们还在 LineMOD 数据集上进行评估,其中我们可以与其他合成训练方法竞争。当物体偏离图像中心时,通过纠正三维方向估计来进一步提高性能,并展示了扩展结果。
Feb, 2019
本文通过将旋转分解为视角旋转和平面内旋转的组合,提出了一种名为 VI-Net 的新型旋转估计网络,用于解决 6D 物体姿态估计中高精度的 RGB-D 物体观测的旋转估计难题。通过基于球面的特征学习,在两个不同分支上进行估计,并通过神经网络实现视角旋转和平面内旋转的估计。通过实验证明了该方法在高精度情况下较现有方法的优越性,尤其在无 CAD 模型情况下的类别级 6D 物体姿态估计任务中。
Aug, 2023
该论文旨在使用自动编码器的框架来实现物体的 6D 位姿估计,通过度量学习和旋转检索等方法来提高对象类别的推广能力,最终在两个基准测试中展示了最先进的表现。
Jul, 2021
本文提出了一种用于无约束端到端头部姿态估计的方法,通过引入旋转矩阵形式主义来解决旋转标签的问题,并提出了连续的 6D 旋转矩阵表示来实现高效和稳健的直接回归,同时为了弥补旋转数据的几何特性,我们使用了基于测地线距离的损失函数。在公共数据集上的实验结果表明,我们每一个方面都超过了其他先进方法,提高了将近 20%。
Feb, 2022
本研究提出了一种基于深度学习的方法,通过创建有关先前学习类别形状先验信息的 3D 对象模型并推断出深度观测和 3D 模型之间的密集对应关系,使得能够从 RGB-D 图像中恢复未看见的物体实例的 6D 姿态和大小。
Jul, 2020
提出了一种基于几何学的、适用于具有严重类内形状变化的物体类别级别姿态估计系统 GPV-Pose,该系统通过引入自信驱动旋转表示法和几何引导的点对点投票模式来提高分类级别姿态敏感特征的学习,并利用不同的输出流来实现几何一致性项的推理,优于公共基准测试的最新竞争对手,同时在 20 FPS 的实时推理速度下几乎达到最佳表现。
Mar, 2022