ICCVMay, 2021

SAT: 2D 语义辅助的 3D 视觉定位训练

TL;DR该研究提出了 2D Semantics Assisted Training(SAT)来提高 3D 视觉定位的准确性,通过学习丰富,干净的 2D 对象表示与 3D 场景中的对象或提到的实体之间的对齐关系,辅助 3D 视觉定位,将 2D 语义有效地利用于训练,使方法在 3D 视觉定位数据集上的准确性从 37.7%提高到 49.2%,并且在多个 3D 视觉定位数据集上均优于同类方法。