Mar, 2024

点云 - 文本匹配:基准数据集与基线

TL;DR本文提出和研究了一种新的实例级检索任务:点云 - 文本匹配 (PTM),该任务旨在找到与给定的点云查询或文本查询匹配的确切跨模态实例。我们构建了三个新的 PTM 基准数据集,分别是 3D2T-SR、3D2T-NR 和 3D2T-QA。为了解决这些挑战,我们提出了一种名为 RoMa 的 PTM 基准线方法,它由两个模块组成:双重注意感知模块(DAP)和鲁棒负对比学习模块(RNCL)。我们在我们的基准测试上进行了广泛的实验,并展示了 RoMa 的优越性。