Apr, 2024

基于视觉语言辅助的伪标签方法实现弱监督的三维场景图生成

TL;DR通过视觉语言辅助伪标记,我们提出了 3D-VLAP,一种弱监督的三维场景图生成方法,能够对三维点云场景进行语义对齐并生成场景图,从而在减轻数据标注压力的同时实现与完全监督方法可比较的效果。