Apr, 2022
基于空间导向的点云3D密集描述Transformer
Spatiality-guided Transformer for 3D Dense Captioning on Point Clouds
TL;DR该研究提出了一种基于transformer的encoder-decoder结构的3D密集描述方法,包含相对空间感知机制,可以精准地为3D场景中的每个场景对象实现目标检测和自然语言描述生成。在两个基准数据集ScanRefer和ReferIt3D上,该方法均优于基线模型Scan2Cap。