Aug, 2023

3D-STMN: 基于依赖驱动的超点 - 文本匹配网络用于端到端 3D 引用表达式分割

TL;DR3D-RES 中,采用了一个创新的端到端 Superpoint-Text Matching Network (3D-STMN),该网络通过依赖驱动的洞察力丰富而充实。我们的模型具有超点文本匹配机制,该机制通过将语言指示与其对应的类别超点直接相关联,实现了跨模态语义关系的高效利用,并且进一步引入了依赖驱动交互模块来提升模型对指代表达的语义理解,从而提升模型的本地化和分割能力。在 ScanRefer 基准上的综合实验结果表明,我们的模型不仅取得了新的性能标准,在 mIoU 方面提升了 11.7 个百分点,而且速度提升惊人,超过传统方法 95.7 倍。