Jan, 2023

文本和 3D 点云的联合表示学习

TL;DR本文提出了一种新型的 Text4Point 框架,通过利用 2D 图像作为连接点云和语言模态的桥梁,建立图像和点云的对应关系,从而通过对比学习将其对齐;并进一步引入文本查询模块,查询点云特征的文本嵌入,将语言信息整合到 3D 表示学习中,提高各种下游任务的性能。