Jan, 2024

CrossVideo: 点云视频理解的自监督跨模态对比学习

TL;DR本文介绍了一种名为 CrossVideo 的新方法,旨在增强点云视频理解领域的自监督跨模态对比学习。通过利用点云视频和图像视频之间的跨模态关系获取有意义的特征表示,我们提出了一种自监督学习方法来解决数据稀缺和标签获取困难的问题。通过使用单模态和跨模态对比学习技术,我们实现了对点云视频的有效理解,并提出了一种适用于两种模态的多层对比方法。通过广泛的实验证明,我们的方法明显超过了先前的最先进方法,并进行了全面的消融研究来验证我们提出的设计的有效性。