Nov, 2023

SOccDPT:在内存限制下训练的基于密集预测变换器的半监督三维语义占用

TL;DR我们提出了 SOccDPT,一种从单目图像输入中使用密集预测变换器进行 3D 语义占用预测的内存高效方法。我们通过对印度行驶数据集和班加罗尔行驶数据集等无结构数据集进行训练,解决了现有方法在结构化交通数据集训练时的局限性。我们的半监督训练流程通过减少手动标注的要求,使用伪基准真实标签代替,产生了我们的班加罗尔语义占用数据集。这种更广泛的训练增强了我们的模型在处理无结构交通场景方面的能力。为了克服训练过程中的内存限制,我们引入了分块训练,在每个时期选择一部分参数进行训练,减少了自动图构建过程中的内存使用。在无结构交通和内存受限的训练和推理环境中,SOccDPT 相对于现有的视差估计方法表现更好,RMSE 分数为 9.1473,语义分割 IoU 得分为 46.02%,并以竞争频率 69.47 Hz 工作。我们公开了代码和语义占用数据集。