Jan, 2024

利用位置编码进行鲁棒的基于多参考点的物体 6D 姿态估计

TL;DR准确估计对象的姿态在计算机视觉和机器人领域是一项关键任务。本文分析了现有方法的局限性,并提出了克服这些局限性的新策略。我们使用了高频成分的位置编码来解决几何表示模糊的问题,并引入了一种基于规范化图像平面的多参考点迭代细化策略来解决细化方法中的局部最小值问题。最后,我们利用自适应实例归一化和简单的遮挡增强方法帮助模型聚焦于目标对象。在 Linemod、Linemod-Occlusion 和 YCB-Video 数据集上的实验证明了我们的方法优于现有方法。我们将很快公布代码。