Oct, 2023

自动驾驶中图像表征向点云的蒸馏重新审视

TL;DR自监督图像网络在解决复杂的 2D 任务(如语义分割、目标发现)时非常高效且几乎没有下游监督要求,然而,当前基于激光雷达数据的自监督 3D 网络表现不佳,因此有几种方法提议将高质量的自监督 2D 特征转移到 3D 网络中,最近在自动驾驶数据上进行的尝试显示了有希望的结果,然而,这些转移后的特征与完全监督的特征之间仍然存在差距,本文重新审视了 2D 到 3D 转移,首先,针对语义分割,我们提出了一种简单的方法,相对于之前的 3D 转移方法实现了显著的提高,其次,我们证明了在高容量的 3D 网络中进行转移对于获得高质量的 3D 特征至关重要,这实际上使我们能够显著缩小无监督转移的 3D 特征与完全监督特征之间的差距,最后,我们表明我们所得到的高质量转移表示还可以用于开放词汇的分割和背景 / 前景发现。