通过场景图增强视觉语言模型用于交通事故理解

Jul, 2024

通过场景图增强视觉语言模型用于交通事故理解

Enhancing Vision-Language Models with Scene Graphs for Traffic Accident Understanding

Aaron Lohner, Francesco Compagno, Jonathan Francis, Alessandro Oltramari

TL;DR通过将交通场景表示为场景图，并将其与视觉和语言模态对齐进行事故分类，在交通事故识别中引入多阶段、多模态的流水线能够提高分类准确率。

Abstract

Recognizing a traffic accident is an essential part of any autonomous driving or road monitoring system. An accident can appear in a wide variety of forms, and understanding what type of accident is taking place

traffic accident autonomous driving accident classification scene graph multimodal pipeline

发现论文，激发创造

基于关系的交通场景图的运动预测

通过建立空间语义场景图和使用图神经网络来探讨 Traffic participants 之间的关系对于预测自动驾驶中的加速度和减速度等相关参数具有重要作用。这种建模方式不仅可以提高预测结果，也可以通过包含先前场景的附加信息提高预测性能。

Nov, 2022

交通场景相似度：基于图形对比学习的方法

通过使用图形来构建一个有意义的嵌入空间，我们的方法展示了场景的连续映射以及基于嵌入结果形成主题相似群集，从而在后续测试过程中识别相似场景，从而减少冗余测试运行。

Sep, 2023

图神经网络用于道路安全建模：事故分析的数据集和评估

本文通过构建一个大规模、统一的数据集，总计 900 万条交通事故记录，并结合道路网络和交通量报告，评估了现有的深度学习方法在预测道路上事故发生的准确性。研究发现，图神经网络（如 GraphSAGE）能够准确预测道路上事故的数量，平均绝对误差低于 22%（相对于实际计数），并且对于是否会发生事故的预测准确率高达 87% 以上（通过平均州统计）。通过多任务学习考虑州际变异性和迁移学习将交通量与事故预测相结合，取得这些结果。消融研究凸显了道路图结构特征的重要性。最后，讨论了分析的意义并开发了一个使用该数据集的便捷包。

Oct, 2023

时空事件图像用于动态场景理解

该论文介绍了关于动态场景理解的研究，主要涉及自动驾驶、道路事件检测、视频活动检测、持续学习等内容。

Dec, 2023

复杂交通场景分类的图卷积网络

通过建立场景分类方法，可以减少获得自动驾驶系统（ADS）安全性的统计显著证据所需的时间。我们提出了一种能够模拟车辆与环境以及其他交通参与者之间交互的复杂交通场景分类方法，利用图卷积网络来建模这些场景的空间和时间特征，并在覆盖不同驾驶环境并逐帧进行注释的数据集上进行训练，为未来关于逐帧复杂场景分类的研究提供了有前景的基线。

Oct, 2023

预训练图神经网络基于自动驾驶的智能交通场景理解模型

基于图注意力网络的通用预训练场景理解模型能够学习交通场景的通用交互和推理，支持各种下游任务，通过在城市和高速公路场景中进行验证实验，证明了该模型具有广泛应用的潜力，并通过消融实验展示了预训练任务设计的有效性。

Apr, 2024

SCENE: 使用异构图神经网络推理交通场景

本文提出了 SCENE 方法，通过使用异构图神经网络编码交通场景，利用层级图卷积和任务特定解码器进行推理和预测。结果表明，该方法在节点分类任务上表现优异，并具有较强的泛化性。

Jan, 2023

第一人称视角视频的无监督交通事故检测

本文提出了一种基于未监督学习的方法，通过预测交通参与者未来位置并监测三种不同策略的预测准确度和一致性来检测仪表板安装的摄像头视频中的交通事故。实验结果表明，该方法优于最先进的方法。

Mar, 2019

基于上下文视觉转换器的交通事故风险预测

本文提出了一种通过上下文视觉变换器进行端到端训练的新框架，该框架可以有效地推理有关问题的空间和时间方面，同时提供准确的交通事故风险预测，并在两个不同地理位置的大规模交通事故数据集上优于现有技术。

Sep, 2022

CRASH: 碰撞识别和预测系统，集成环境感知和时间焦点注意力

提出了一种新颖的针对自动驾驶汽车的事故预测框架，名为 CRASH，该框架融合了物体检测器、特征提取器、物体感知模块、上下文感知模块和多层融合模块，通过计算交通代理之间的时空关系和捕捉交通场景中潜在物体的细粒度视觉特征，能够准确及时地预测交通事故。该模型在实际数据集上的评估结果表明，在诸如平均精确度和时间到事故的平均值等关键评估指标上，超过了现有的顶级基准。尤其是在有限的训练数据或缺失数据的具有挑战性的驾驶场景中，该模型表现出了强大的鲁棒性和适应性，展现了在实际自动驾驶系统中的重要应用潜力。

Jul, 2024