Dec, 2023

自动驾驶可视数据集的属性注释与偏差评估

TL;DR本研究关注在自动驾驶领域中经常被忽视的公平问题,特别是在基于视觉感知和预测系统方面,这对自动驾驶车辆的整体运行起着至关重要的作用。我们重点分析了用于训练人和车辆检测系统的一些常用视觉数据集中存在的偏见。我们引入了一种注释方法和一种专门的注释工具,旨在对视觉数据集中的属性进行注释。通过评估一致性和属性在所有数据集中的分布,我们验证了我们的方法。这些属性包括年龄、性别、肤色、群体以及超过 90K 人的交通方式和超过 50K 辆车的车辆类型、颜色和车型的注释。大多数属性的多样性非常低,分析的数据集中某些群体,如儿童、轮椅使用者或个人机动车辆使用者,极度缺乏代表性。本研究在评估自动驾驶车辆感知和预测系统中考虑公平性方面做出了重要贡献。本文遵循可重复性原则,注释工具、脚本和注释属性可公开访问。