Nov, 2023

Text2Loc:3D 点云定位的自然语言描述方法

TL;DR我们提出了一种新型的神经网络 Text2Loc,通过几个自然语言描述实现了基于 3D 点云定位,并完全解释了点与文本之间的语义关系,实现了粗 - 细定位的本地化过程,文本子图全局位置识别中,用分层 Transformer 和最大池化捕获了每个文本提示之间的关系动态,而使用文本子图对比学习保持了正负样本之间的平衡;此外,我们还提出了一种新颖的无匹配精细定位方法,进一步提升了位置预测的准确性,摆脱了复杂的文本实例匹配需求,并且比之前的方法更轻量化、更快速、更准确。大量实验证明,Text2Loc 在 KITTI360Pose 数据集上超过了当前最先进技术,定位准确度提升了 2 倍。我们将公开提供代码。