Jun, 2024

3D 视觉定位的双属性空间关系对齐

TL;DR提出了 DASANet,一种用于模型属性和空间关系特征的双重对齐网络,能够实现在语言和 3D 视觉模态之间建立联系,提高基于 3D 视觉的定位准确性。