Mar, 2024

多摄像机鸟瞰视角分割的透视线索训练框架

TL;DR通过利用大量的未标记数据,本研究提出了一种新的训练框架 Perspective Cue Training (PCT),该框架使用从公开的基于大型街景数据集训练的语义分割模型生成的未标记透视图像的伪标签,并将透视图任务头应用于图像编码器,与 bird's-eye-view 分割头共享,从而有效地利用未标记数据进行训练。此外,引入了 Camera Dropout (CamDrop) 和 BEV Feature Dropout (BFD) 通过强有力的输入扰动提高半监督学习能力。综合方法简单灵活以实现卓越性能,较多基准模型在半监督学习和无监督领域适应中都取得了显著改进,甚至达到了与当前最先进方法的竞争性性能。