基于相关融合的 6D 姿态估计

Sep, 2019

6D Pose Estimation with Correlation Fusion

Yi Cheng, Hongyuan Zhu, Ying Sun, Cihan Acar, Wei Jing...

TL;DR本文提出了一种新的方法，使用注意力机制有效地考虑 RGB 和深度之间的相关性，探索了用于确保 RGB 和深度之间有效信息流的内部和交叉相关模块的有效融合策略。实验结果表明，该方法在对象姿态估计方面的表现优于现有方法，并证明了该方法可以为真实世界的机器人抓取任务提供准确的物体姿态估计。

Abstract

6d object pose estimation is widely applied in robotic tasks such as grasping and manipulation. Prior methods using RGB-only images are vulnerable to heavy occlusion and poor illumination, so it is important to complement them with depth information. However, existing methods using

6d object pose estimation rgb-d data attention mechanism fusion strategies robot grasping

发现论文，激发创造

密集融合：通过迭代密集融合实现 6D 物体姿态估计

本文提出了 DenseFusion 框架，使用异构网络结构从 RGB-D 图像中估计已知物体的 6D 位姿，并通过端对端迭代位姿细化进一步提高了姿态估计的精度和实时性。实验结果表明，我们的方法在 YCB-Video 和 LineMOD 数据集上优于现有方法，并在实际机器人应用中实现了对物体的抓取和操作。

Jan, 2019

MoreFusion: 基于体素融合的多目标推理技术在 6D 位姿估计中的应用

提出了一种基于多视角视野的实时视觉系统，可以从单个 RGB-D 视角提出三维物体姿态建议，并且根据多个视角的姿态估计和非参数占用信息积累这些姿态估计，从而对接触的多个已知对象进行一致的、不相交的姿态估计。应用于实时机器人应用程序中，只使用机载 RGB-D 视觉，机械臂可以精确而有序地拆卸复杂的物体堆放，展示了其准确性和鲁棒性。

Apr, 2020

MV6D: 使用深度点投票网络的 RGB-D 框架多视角 6D 位姿估计

提出了一种名为 MV6D 的多视角 6D 姿态估计方法，该方法使用多个视角的 RGB-D 图像，通过 DenseFusion 层融合每个视角的图像，可以精确预测杂乱场景中所有对象的 6D 姿态.

Aug, 2022

通过学习 RGB-D 特征实现鲁棒的 6D 物体姿态估计

本文提出了一种离散连续的旋转回归公式来解决对称物体旋转不确定性问题，并通过点聚集向量来检测物体位置，并在 LINEMOD 和 YCB-Video 基准测试中得到比现有方法更好的表现。

Feb, 2020

基于多模态注意力融合的 RGB - 深度图像语义分割模型

本文提出了一种有效的编码器 - 解码器模型和基于注意力的融合模块，以集成 RGB-Depth 图像的特征，从而提高语义分割的精度和计算效率。实验结果表明，该模型在计算成本和模型大小方面大大超越了现有的最先进模型，并且在准确性方面具有良好的性能。

Dec, 2019

自监督 6D 物体姿态估计中的伪流一致性

无需辅助信息，我们提出了一种使用纯 RGB 图像进行训练的 6D 物体姿态估计方法，通过利用来自多个不同视角的合成至实图像对中的几何约束（以像素级流一致性的形式表示）进行精化策略，从合成图像中获得初始姿态估计，并使用动态生成的伪标签。在三个具有挑战性的数据集上进行评估，结果表明我们的方法明显优于最先进的自监督方法，无需 2D 注释或额外的深度图像。

Aug, 2023

光学和场景流的注意力多模态融合

通过使用深度神经网络，并在不同的网络级别中应用自注意力机制以及交叉注意力机制，我们提出了一种名为 FusionRAFT 的方法，实现了早期传感器模态（RGB 和深度）之间的信息融合，以解决 RGB 信息不可靠的问题，在主动配准中取得了比最近方法更好的性能。

Jul, 2023

扩展用于立体视觉的 6D 物体姿态估计器

使用稠密特征从 RGB 图像中直接回归物体的 6D 姿态是一个困难的任务，但最近的方法通过利用稠密特征在直接回归姿态方面取得了最先进的结果。使用立体视觉可以减少姿态的模糊性和遮挡，并且可以直接推断物体的距离。为了扩展立体的 6D 物体姿态估计到最新技术，我们创建了与 YCB-V 数据集兼容的立体版本。我们的方法利用立体视觉优于最先进的 6D 姿态估计算法，并且可以容易地用于其他基于稠密特征的算法。

Feb, 2024

RGBD 图像中的人体姿态三维估计用于机器人任务学习

利用 RGBD 图像估算 3D 人体姿态，通过关键点检测器和深度信息实现 3D 提升，在真实环境下通过学习演示框架指示服务机器人模仿人类教师的操作，超越了单眼调色板和深度姿态估计方法的性能。

Mar, 2018

具有有限数据的光度挑战物体的多模态六自由度姿态估计的偏振信息

利用极化信息的监督学习方法以及借助物理特性的自监督学习方法取得重要进展，通过利用极化光的几何信息和引入形状先验知识和可逆物理约束来提高姿态估计的准确性。

Aug, 2023