Jan, 2024

大数据驱动的安全自动驾驶中使用主动学习的原因、时间和方法:一项实证研究

TL;DR在自动驾驶数据集中,采用主动学习策略可以解决数据不平衡、冗余和高维数据的挑战。我们展示了使用信息熵查询来选择信息丰富的样本,旨在降低注释成本和提高模型性能的有效性。我们在 nuScenes 数据集上使用 BEVFusion 模型进行了实验,将主动学习与随机抽样进行比较,并证明信息熵查询在大多数案例中表现优异。该方法在减少多数类和少数类之间的性能差距方面特别有效。类别特定的分析揭示了对有限数据预算进行注释资源的有效配置,强调选择多样性和信息丰富的数据用于模型训练的重要性。我们的发现表明,在资源受限的环境中,信息熵查询是选择增强模型学习的数据的一种有前途的策略。