AAAIFeb, 2024

MM-Point:多视图信息增强的多模态自监督 3D 点云理解

TL;DR提出一种新颖的自监督点云表示学习方法 MM-Point,通过多模态交互和传输同时处理三维物体和多个二维视图之间的一致跨模态目标,以及通过多个 MLP 和多层次增强策略来更有效地实现二维多视图信息的一致性对比学习,进一步学习了二维多视图的多层次不变性。MM-Point 在各种下游任务中展现出最先进的性能,如在合成数据集 ModelNet40 上达到了 92.4% 的峰值准确率,在真实数据集 ScanObjectNN 上达到了 87.8% 的最高准确率,与全监督方法可媲美。此外,我们还展示了它在少样本分类、三维部分分割和三维语义分割等任务中的有效性。