Jun, 2024

提升数据高效三维场景理解的表示学习的泛化能力

TL;DR通过利用生成贝叶斯网络产生具有真实世界模式的多样化合成场景,并通过联合学习粗到精的对比学习任务和遮挡感知重建任务,我们提出了可泛化的表示学习(GRL)方法,从而为三维场景的理解提供了可传递、几何信息化的表示。在合成数据的预训练之后,我们的模型的所掌握的知识可以通过真实世界基准数据集实现无缝传递到与三维场景理解相关的两个主要下游任务,即三维物体检测和三维语义分割,并通过详尽系列的实验证明了我们方法相对于现有最新预训练方法的持续优势。