Rank2Tell: 一种用于联合重要性排序和推理的多模态驾驶数据集
提出了一个用于自动驾驶的新数据集 Reason2Drive,其中包含了 600K 个视频文本对,以促进对复杂驾驶环境中可解释推理的研究。基于该数据集进行实验评估各种现有的视觉语言模型,并通过开发一种有效的方法来提高模型的推理准确性。
Dec, 2023
该研究介绍了一个多模态数据集,其中包括雷达、相机和激光雷达,以提高自主驾驶汽车的稳健性和长程感知并训练 3D 物体检测模型,并在 GitHub 上提供数据。
Nov, 2022
本文呈现了用于自动驾驶关键方面的新数据集,介绍了交通参与者行为的可变性,并展示了天气条件、地理位置、交通和人口统计学等因素如何影响交通行为及场景的视觉复杂度。地面真相数据传达了有关参与者位置(边界框)、物理条件(例如照明和速度)和各参与方的行为的信息。
Sep, 2016
该研究对自主驾驶车辆的决策制定模块进行了探讨,提出了数据驱动决策制定方法的重要性,并对车辆、环境和驾驶员状况的数据进行了比较和总结,进一步总结了数据集的潜在应用及未来发展趋势。
Jun, 2023
智能车辆系统需要深入了解道路状况、周围实体和自我驾驶行为之间的相互作用,以实现安全高效的导航,而在发展中国家,交通情况往往密集且无序,道路使用者也异质性强。现有数据集主要针对结构化和稀疏的交通场景,未能捕捉到在这种环境中驾驶的复杂性。为了填补这一空白,我们提出了一个大规模的双视角驾驶视频数据集 IDD-X。通过提供 697K 个边界框、9K 个重要对象轨迹和每个视频 1-12 个对象,IDD-X 为多个重要道路对象提供了综合的自我驾驶相关注释,覆盖了 10 个类别和 19 个解释标签类别。该数据集还结合倒车影像信息,以提供对驾驶环境更全面的表征。我们还引入了专为多个重要对象定位和每个对象解释预测而设计的深度网络。总体而言,我们的数据集和推出的预测模型为研究道路状况和周围实体如何影响复杂交通情况下的驾驶行为奠定了基础。
Apr, 2024
自动驾驶发展迅速,硬件和深度学习方法的新进展表现出了良好的性能,高质量的数据集对于开发可靠的自动驾驶算法至关重要。本研究全面调查了 200 多个自动驾驶数据集的多个方面,并引入了一种新的评估指标来评估每个数据集的影响,为建立新的数据集提供了指导。此外,还分析了数据集的注释过程和质量,并对几个重要数据集的数据分布进行了深入分析。最后,讨论了未来自动驾驶数据集的发展趋势。
Jan, 2024
本研究综述了车辆对基础设施(V2I)、车辆对车辆(V2V)和车辆对一切(V2X)的协作感知数据集,重点关注用于自动驾驶车辆感知任务的大规模基准的最新发展。该论文系统地分析了各种数据集,比较了它们在多样性、传感器设置、质量、公开可用性和对下游任务的适用性等方面,同时突出了领域转移、传感器设置限制以及数据集多样性和可用性方面的关键挑战。强调了在数据共享和数据集创建方面解决隐私和安全问题的重要性。结论强调了需要全面、全球可访问的数据集以及技术和研究社区的协作努力来克服这些挑战,并充分发挥自动驾驶的潜力。
Apr, 2024
该论文通过高分辨率的文本图像生成技术,开发了一种针对多模态推理任务的评估数据生成框架,并使用此框架生成了一种复杂且缺乏数据集支持的任务的合成数据集,以进行性能测试。研究发现,在这项任务上,最先进的视觉问答模型的性能明显低于标准 VQA 任务。
Jun, 2023
本研究关注在自动驾驶领域中经常被忽视的公平问题,特别是在基于视觉感知和预测系统方面,这对自动驾驶车辆的整体运行起着至关重要的作用。我们重点分析了用于训练人和车辆检测系统的一些常用视觉数据集中存在的偏见。我们引入了一种注释方法和一种专门的注释工具,旨在对视觉数据集中的属性进行注释。通过评估一致性和属性在所有数据集中的分布,我们验证了我们的方法。这些属性包括年龄、性别、肤色、群体以及超过 90K 人的交通方式和超过 50K 辆车的车辆类型、颜色和车型的注释。大多数属性的多样性非常低,分析的数据集中某些群体,如儿童、轮椅使用者或个人机动车辆使用者,极度缺乏代表性。本研究在评估自动驾驶车辆感知和预测系统中考虑公平性方面做出了重要贡献。本文遵循可重复性原则,注释工具、脚本和注释属性可公开访问。
Dec, 2023