Sep, 2023

Diff-DOPE:可微分的深度目标姿态估计

TL;DR我们引入了 Diff-DOPE,这是一种 6 自由度姿态微调器,其输入为图像、一个物体的 3D 纹理模型和物体的初始姿态。这种方法使用可微渲染来更新物体姿态,以减小图像与模型投影之间的视觉误差,我们展示了这种简单且有效的想法能在姿态估计数据集上达到最先进的结果。我们的方法与最近的方法有所不同,最近的方法中姿态微调器是在大型合成数据集上训练的深度神经网络,用于将输入映射到微调步骤,而我们的可微渲染的使用使我们能够完全避免训练。我们的方法可以同时进行多个梯度下降优化,使用不同的随机学习率,以避免对称对象、相似外观或错误步长的局部最小值。可以使用各种模态,例如 RGB、深度、强度边缘和物体分割掩码。我们进行了一系列实验,研究了各种选项的效果,结果表明,当 RGB 图像与物体掩码和深度图像一起用于引导优化过程时,能获得最佳的结果。