May, 2021
SAT: 2D语义辅助的3D视觉定位训练
SAT: 2D Semantics Assisted Training for 3D Visual Grounding
TL;DR该研究提出了2D Semantics Assisted Training(SAT)来提高3D视觉定位的准确性,通过学习丰富,干净的2D对象表示与3D场景中的对象或提到的实体之间的对齐关系,辅助3D视觉定位,将2D语义有效地利用于训练,使方法在3D视觉定位数据集上的准确性从37.7%提高到49.2%,并且在多个3D视觉定位数据集上均优于同类方法。