通用相对物体姿态估计的三维感知假设与验证
用 RGB-D 参考图像的 2.5D 形状、现成可微分渲染器以及 DINOv2 预训练模型提取的语义线索为基础,无需标记和训练,提出了一种新颖的可推广的三维相对姿态估计方法,通过渲染与对比新的 RGB 和语义地图,实现了只需单个 RGB-D 参考图像可用于未见过的对象的姿态估计。
Jun, 2024
本文提出一种基于分割的 6D 姿态估计框架,使用关键点检测获取局部姿态预测,并根据置信度预测将这些姿态候选融合成可靠的 3D-to-2D 对应关系,从而在多个低纹理物体相互遮挡的情况下获得最优姿态估计,其采用简单且高效的架构实现实时性能。
Dec, 2018
通过弱监督学习和人群注释者提供的深度相对估计信号,我们提出一种 3D 人体姿势估计算法,用于只在 2D 输入图像中学习。结果竞争力优于目前现有算法,可为在未经过精心控制的现实世界中进行 3D 姿势估计开辟道路。
May, 2018
该论文提出了一种称为 CosyPose 的方法,能够从一组待定相机视图的场景中,准确地恢复多个已知对象的 6D 姿态,并且能够处理对象的对称性,不需要深度测量,还能自动还原场景中的物体数量,并解决了通过解决对象级捆绑调整问题实现对全局场景的细化。
Aug, 2020
本论文提出了一种使用全局推理的新型全连接 CRF 方法来生成位姿假设池,相较于基于局部推理的方法,该方法提供了超过当前难度较大的 “被遮挡物体数据集” 位姿估计最新技术的结果。
Dec, 2016
本文提出了一种基于合成图像或少量真实图像训练的 6D 物体位姿估计方法,使用第一网络获得粗略姿态估计后,使用第二网络预测精细的二维对应场,并推断所需的姿态纠正,该方法在显著减少合成图像与真实图像领域差异的情况下具有与需要标注真实图像训练的方法相当的性能,而在使用 20 张真实图像时,它的性能明显优于它们。
Mar, 2022
提出了一种基于多视角视野的实时视觉系统,可以从单个 RGB-D 视角提出三维物体姿态建议,并且根据多个视角的姿态估计和非参数占用信息积累这些姿态估计,从而对接触的多个已知对象进行一致的、不相交的姿态估计。应用于实时机器人应用程序中,只使用机载 RGB-D 视觉,机械臂可以精确而有序地拆卸复杂的物体堆放,展示了其准确性和鲁棒性。
Apr, 2020
本文针对 3D 图像生成开展了探索,提出了一种基于多任务卷积神经网络的通用 3D 方案。通过建立代理 3D 任务来提供训练,神经网络在完成核心问题的同时也具备泛化能力和抽象能力,并在多个场景取得了超越 SIFT 等方法的成果。
Oct, 2017
研究利用对已知物体类别学习到的特征来估算未知类别物体的三维姿态,提出无需 CAD 模型知识的类不可知对象视角估计的对比学习方法,实验结果表明该方法在多个数据集上具有最佳表现,包括使用 CAD 模型作为输入的方法。
May, 2021