自动驾驶可视数据集的属性注释与偏差评估

Dec, 2023

自动驾驶可视数据集的属性注释与偏差评估

Attribute Annotation and Bias Evaluation in Visual Datasets for Autonomous Driving

David Fernández Llorca, Pedro Frau, Ignacio Parra, Rubén Izquierdo, Emilia Gómez

TL;DR本研究关注在自动驾驶领域中经常被忽视的公平问题，特别是在基于视觉感知和预测系统方面，这对自动驾驶车辆的整体运行起着至关重要的作用。我们重点分析了用于训练人和车辆检测系统的一些常用视觉数据集中存在的偏见。我们引入了一种注释方法和一种专门的注释工具，旨在对视觉数据集中的属性进行注释。通过评估一致性和属性在所有数据集中的分布，我们验证了我们的方法。这些属性包括年龄、性别、肤色、群体以及超过 90K 人的交通方式和超过 50K 辆车的车辆类型、颜色和车型的注释。大多数属性的多样性非常低，分析的数据集中某些群体，如儿童、轮椅使用者或个人机动车辆使用者，极度缺乏代表性。本研究在评估自动驾驶车辆感知和预测系统中考虑公平性方面做出了重要贡献。本文遵循可重复性原则，注释工具、脚本和注释属性可公开访问。

Abstract

This paper addresses the often overlooked issue of fairness in the autonomous driving domain, particularly in vision-based perception and prediction systems, which play a pivotal role in the overall functioning o

fairness autonomous driving vision-based perception visual datasets annotation methodology

发现论文，激发创造

自主驾驶中的公平性：对挑战性天气下目标检测的混淆因素的理解

自主驾驶车辆部署迅速扩张至多个城市。本研究分析了目前最先进的基于 Transformer 的目标检测器中对行人检测公平性的全面实证分析，包括经典度量和新颖的基于概率的度量，以探索保护属性和环境因素对目标检测性能的影响。

May, 2024

野外视觉属性预测学习

本研究提出一种用于预测对象视觉属性的大规模数据集，通过多标签分类解决对象属性预测问题，并采用多种技术来解决大量属性、标签稀疏性、数据不平衡和对象遮挡等问题，其中包括使用低级和高级 CNN 特征、多跳关注、重新加权和重新抽样技术、负标签扩展和监督属性感知对比学习算法，并取得了超过现有技术水平的 3.7 mAP 和 5.7 F1 值的改进。

Jun, 2021

自动驾驶数据集综述：数据统计、标注和展望

自动驾驶发展迅速，硬件和深度学习方法的新进展表现出了良好的性能，高质量的数据集对于开发可靠的自动驾驶算法至关重要。本研究全面调查了 200 多个自动驾驶数据集的多个方面，并引入了一种新的评估指标来评估每个数据集的影响，为建立新的数据集提供了指导。此外，还分析了数据集的注释过程和质量，并对几个重要数据集的数据分布进行了深入分析。最后，讨论了未来自动驾驶数据集的发展趋势。

Jan, 2024

分析和减轻弱势群体偏见：迈向数据集的平衡代表性

通过对脆弱道路用户的分类不平衡、性能评估和偏见影响评估进行研究，我们提出了一种模型优化和偏见缓解的方法，包括数据增强、重采样和度量特定学习，以改善自动驾驶中感知系统的准确性和公正性。

Jan, 2024

自动驾驶决策数据集调查

该研究对自主驾驶车辆的决策制定模块进行了探讨，提出了数据驱动决策制定方法的重要性，并对车辆、环境和驾驶员状况的数据进行了比较和总结，进一步总结了数据集的潜在应用及未来发展趋势。

Jun, 2023

非正式对话 v2 数据集

本研究介绍了一个数据集，有助于评估算法偏见和计算机视觉和语音模型在 11 个属性方面的鲁棒性。数据集包括来自巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国的 26,467 个视频。参与者同意将其数据用于评估 AI 模型的公平性并提供了多种人口统计学信息。

Mar, 2023

数据审计：识别任务模型中的属性效用偏差和可检测性偏差

本文提出了一种通过量化筛选医学图像数据集属性的风险，在确定性和效用之间进行分解的技术，以识别深度学习算法中可能导致偏见的细微因素，并通过通过真实反事实的比较性能证明了其有效性和灵敏度，最后将该方法应用于一种流行的皮肤病变数据集的自然属性中，并演示了其成功。

Apr, 2023

自动驾驶中的协同感知数据集调查

本研究综述了车辆对基础设施（V2I）、车辆对车辆（V2V）和车辆对一切（V2X）的协作感知数据集，重点关注用于自动驾驶车辆感知任务的大规模基准的最新发展。该论文系统地分析了各种数据集，比较了它们在多样性、传感器设置、质量、公开可用性和对下游任务的适用性等方面，同时突出了领域转移、传感器设置限制以及数据集多样性和可用性方面的关键挑战。强调了在数据共享和数据集创建方面解决隐私和安全问题的重要性。结论强调了需要全面、全球可访问的数据集以及技术和研究社区的协作努力来克服这些挑战，并充分发挥自动驾驶的潜力。

Apr, 2024

FACET：计算机视觉评估基准的公平性

计算机视觉模型在性别和肤色等属性方面存在已知的性能差异。本论文提出了一个名为 FACET（计算机视觉公平性评估）的新基准，它是一个大型、公开可用的评估集，包括 32,000 张图片，用于图像分类、目标检测和分割等常见视觉任务。我们通过对 FACET 中的每张图像进行手动标注，包括感知肤色和发型类型等与人相关的属性，手动绘制边界框，并标记诸如唱片骑师或吉他手等精细的与人相关的类别。我们利用 FACET 对最先进的视觉模型进行基准测试，并展示潜在的性能差异和挑战。我们的研究结果显示，分类、检测、分割和视觉定位模型在人口属性和属性交叉上存在性能差异。这些伤害表明，在这些视觉任务中，并不是所有的人都能得到公平和公正的对待。我们希望使用我们的基准测试结果能够为更加公平、更加稳健的视觉模型做出贡献。FACET 在该 https URL 上公开可用。

Aug, 2023

基于属性下降的内容一致性车辆数据集模拟

本研究使用图形引擎模拟了大量的免标注训练数据，聚焦于减小内容差异，通过属性下降算法让 VehicleX 数据逼近真实数据，并结合真实数据集进行测试，获得了强大的实现结果。

Dec, 2019