DPPE:在 Plenoxels 环境中使用梯度近似进行密集姿态估计
本文提出了一种基于密集对应的三阶段六自由度物体检测方法,称为 DPODv2(密集姿势物体检测器),结合了 2D 物体检测与密集对应估计网络以及多视图姿态细化方法来估计完整的 6 自由度姿态,其使用了不同成像模式(RGB 或 Depth)作为输入。实验结果表明,RGB 成像在对应估计方面表现优异,而如果存在良好的 3D-3D 对应,则深度成像可提高姿势精度。
Jul, 2022
利用单个 RGB-D 图像,我们引入了一种新颖的方法来计算物体的 6DoF 姿态。通过密集对应,我们回归每个可见像素的物体坐标,从而有效降低输出空间并取得出色的性能,在 6D 姿态估计中胜过大多数先前的方法,特别是在遮挡场景中具有显著改进的优势。
May, 2024
在点云配准领域,本文介绍了一种轻量级的基于学习的姿态评估器(Deep-PE),用于增强姿态选择的准确性,特别是在低重叠的挑战性点云场景中。该网络结合了姿态感知注意力模块和姿态置信度预测模块,通过学习不同候选姿态下点云的对齐状态来提高注册的成功率。在多个基准测试中,Deep-PE 在低重叠率的情况下,相对于基于手工 FPFH 和基于学习的 FCGF 描述符的最先进方法,注册召回率分别提高了至少 8% 和 11%。据我们所知,这是第一项利用深度学习在没有显式输入对应关系的情况下选择最优姿态的研究。
May, 2024
本文介绍了一种能够从 RGB 图像中检测三维物体和估计六自由度姿态的新型深度学习方法,称为 DPOD。该方法估计输入图像和可用的三维模型之间的密集多类二维三维对应关系图,通过 PnP 和 RANSAC 计算六自由度姿态,并使用基于深度学习的自定义方案对初始姿态估计进行了 RGB 姿态优化。与其他主要使用真实数据进行训练且不对合成渲染进行训练的方法不同,我们对合成数据和真实训练数据进行评估,显示出在所有最近的检测器中,此方法无论先前和后面都能够获得优异的结果。虽然具有精度,但本方法仍然具有实时性能。
Feb, 2019
提出了一种基于自编码器、Pix2Pose 的 6D 姿态估计方法,可以精确地检测对称目标并处理部分遮挡的问题,无需依赖专家知识或特殊扫描设备进行 3D 建模,且在三个基准数据集上表现优于现有方法。
Aug, 2019
一种基于密度场重建方法的准确稳健 3D 物体姿态估计系统,适用于小型具有挑战性反射表面的已知 3D 模型对象,并通过单个手腕摄像头驱动的机械臂,可以在几分钟内从零开始扫描场景、检测和估计多个对象的 6 自由度姿态。
Jan, 2024
本研究利用深度神经网络进行对物体在已知场景下的姿态估计,其中提出了使用场景无关的神经网络模型 PixLoc,通过特征学习和度量学习方法将相机定位问题转换为多尺度特征直接对齐,该模型以像素数据作为输入并经过端到端训练后能够在大型环境中实现定位,同时通过精确的稀疏特征匹配以更小的代价实现关键点和姿态的联合优化。
Mar, 2021
通过强化学习,使用 2D 图像注释作为微弱监督的 6D 姿态信息,我们构建了一个无需真实世界 6D 标签的 6D 姿态微调模型,从而实现了优化姿态模型的有效方法。
Feb, 2021
通过使用编码器 - 解码器网络以及 PnP-RANSAC 算法,估算单张 3D 模型可得的 RGB 输入图像中刚性对象的 6D 位姿,对具有全局或部分对称性的挑战性物体采用紧凑表面片段进行表示。
Apr, 2020
3D 人体姿势估计任务使用 2D 图像或视频预测 3D 空间中的人体关节坐标。本论文提出了一种基于扩散模型的 Fine-Grained Prompt-Driven Denoiser(FinePOSE)用于 3D 人体姿势估计,通过构建细粒度的部分感知提示、建立精细的沟通以及整合动态信息来提高去噪质量,并在公开数据集上展开了广泛实验,显示出 FinePOSE 在单人姿势估计以及多人复杂场景中的潜力。
May, 2024