Apr, 2024

基于语言驱动的多样化开放集 3D 物体检测的主动学习

TL;DR提出了 VisLED 算法,一种基于语言驱动的主动学习框架,用于多样的开放式 3D 物体检测,通过查询多样且有信息量的样本数据,提高模型对少数类别或新颖物体的检测能力。在 nuScenes 数据集上的实验证明,相比于随机抽样和熵查询方法,VisLED 算法在提高目标检测性能方面表现出色,并且尽管熵查询方法在模型优化方面具有竞争力,但 VisLED 算法仍然具有相当的性能,突显了 VisLED 算法在自动驾驶场景中改进目标检测的潜力。