以语言形式学习交通事故：数据集，基准和假设性因果分析

Jun, 2024

以语言形式学习交通事故：数据集，基准和假设性因果分析

Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses

Zhiwen Fan, Pu Wang, Yang Zhao, Yibo Zhao, Boris Ivanovic...

TL;DR本研究在大规模交通事故语言数据集 CrashEvent 的基础上，利用大型语言模型 CrashLLM 提出了一种新的交通事故特征学习方法，从复杂的、非结构化数据中解析和学习，预测交通事故的类型、严重程度和受伤人数，并通过学习的推理特征为交通安全分析提供有价值的洞见。

Abstract

The increasing rate of road accidents worldwide results not only in significant loss of life but also imposes billions financial burdens on societies. Current research in traffic crash frequency modeling and anal

road accidents traffic crash frequency modeling crashevent crashllm injury outcomes

发现论文，激发创造

基于多模式大型语言模型的交通安全关键事件自动检测

利用多模态大语言模型对自动驾驶视频进行自动分析，以提高安全性和可靠性，确保准确、可靠和可操作的危险检测，并改善安全事件检测和复杂环境交互的理解。

Jun, 2024

交通事件管理中大型语言模型的严重程度分类整合：一种机器学习方法

该研究评估了大型语言模型对于改善交通事故管理中的机器学习过程的影响，研究了使用事故报告对事故严重程度进行分类时，由现代语言模型生成的特征在改进或匹配预测准确性方面的程度，并进行了多个比较以验证语言模型和机器学习算法的组合。研究结果显示，将语言模型的特征与直接从事故报告中获取的特征进行结合，可以在分配事故严重级别时提高或至少与机器学习技术的性能相匹配，尤其是在采用随机森林和极限梯度提升方法时。该研究对于展示如何将大型语言模型整合到事故管理的机器学习工作流程中，从而简化从非结构化文本中提取特征并改进或匹配事故严重程度预测的精度具有重要贡献。通过有效利用这些语言处理模型来改进事故严重级别分类的建模过程，该研究展示了工程应用实例。本研究为在传统数据基础上利用语言处理能力改进机器学习流程、进行事故严重程度分类提供了重要洞见。

Mar, 2024

大型语言模型在分析碰撞叙述中的应用 ——ChatGPT、BARD 和 GPT-4 的比较研究

交通安全研究中，使用文本分析从事故叙述中提取信息是一种常见做法。本研究使用了三种最流行的公开可用的大型语言模型接口（ChatGPT、BARD 和 GPT4）来探索它们在从艾奥瓦州和堪萨斯州的 100 个事故叙述中提取信息和回答相关问题方面的有效性和界限，结果显示在回答直接问题时相似性较高，但在回答复杂问题时较低，并建议从叙述中提取可行信息时使用多个模型并谨慎使用这些接口获取关键的安全相关信息。

Aug, 2023

交通事故分析与预测的最新进展：机器学习技术的综合综述

此研究通过对最近在交通事故分析和预测中应用机器学习技术的全面回顾，解决了道路安全领域中对先进预测方法的需求。通过分析 191 项研究，重点关注预测事故风险、频率、严重程度、持续时间以及事故数据的统计分析，该研究展示了整合多样化数据源和先进机器学习技术以提高预测准确性并处理交通数据复杂性的有效性。该综述是首次提供如此全面的回顾，概述了与事故分析和预测相关的广泛领域最新研究现状。通过绘制当前研究格局并鉴别文献中的不足，该研究旨在引导未来研究，实现到 2030 年显著减少与交通相关的死亡和伤害目标，与世界卫生组织（WHO）的目标相一致。

Jun, 2024

公路交通事故对异质治疗效果的推断：一种双重鲁棒因果机器学习方法

该研究提出了一种新颖的因果机器学习框架，用于准确估计高速公路不同类型车祸对交通速度的因果效应，该框架基于尼曼 - 鲁宾因果模型、条件 Shapley 值指数和结构因果模型，并结合双重稳健学习方法估算治疗效果。实验结果表明在不同的距离和持续时间下，追尾碰撞引起的拥堵更严重且持续时间更长，而侧面碰撞的延迟影响最长。此外，研究结果还显示夜间追尾碰撞对交通的影响较大，而在高峰时段碰撞到物体的影响最显著。通过统计假设检验、匹配的 “反事实结果” 的误差度量以及敏感性分析进行评估，结果验证了该方法的准确性和有效性。

Jan, 2024

预测交通事故中的重伤程度：新的不平衡数据集和基准

本文介绍了一种新的数据集，用于评估机器学习算法在交通事故中预测伤势严重性方面的表现。数据集通过聚合英国交通部的公开数据集来创建，这些数据集在数据维度上具有极度不平衡以及有时缺少高达 50％的属性，可以通过 MissForest 模型处理。本文还介绍了两种基准方法来创建伤害预测器：一种是监督的人工神经网络，另一种是强化学习模型。该数据集可以刺激机器学习研究在不平衡数据集方面的多个方面，并且这两种方法可以用作在这个领域测试更高级学习算法时的基准参考。

May, 2022

利用文本挖掘分析探索约旦的交通事故叙述

本研究通过文本挖掘分析探索交通事故叙述，旨在为交通安全政策的制定和提升提供信息支持。该研究采用文本挖掘技术来揭示叙述中的关键主题和趋势，以深入了解交通事故的影响因素。研究收集了约旦五条重要高速公路的事故数据，涵盖了 2018 年至 2022 年的 7,587 条记录。采用无监督学习方法从事故数据中学习模式，同时运用主题建模、关键词提取和词共现网络等文本挖掘技术揭示了事故模式的共现情况。结果表明，文本挖掘分析是一种有前景的方法，强调了交通事故的多因素性质，包括人类决策与车辆状况的交织。所有分析中的反复主题突显了采取平衡的道路安全方法的重要性，融合积极和消极的措施。重视驾驶员教育和关于动物相关事件的意识是至关重要的。

Jun, 2024

利用大型语言模型增强基于文本数据的交通预测

利用大语言模型处理文本信息并与历史交通数据结合，提出了一种改进交通预测准确度的新方法。

May, 2024

基于预训练大型语言模型的交通预测框架：TPLLM

TPLLM 是一种基于大型语言模型的交通预测框架，通过构建基于 CNN 的序列嵌入层和基于 GCN 的图嵌入层，提取序列特征和空间特征，并与 LLMs 集成，实现在有限历史交通数据地区的准确预测和良好的泛化能力。

Mar, 2024

图神经网络用于道路安全建模：事故分析的数据集和评估

本文通过构建一个大规模、统一的数据集，总计 900 万条交通事故记录，并结合道路网络和交通量报告，评估了现有的深度学习方法在预测道路上事故发生的准确性。研究发现，图神经网络（如 GraphSAGE）能够准确预测道路上事故的数量，平均绝对误差低于 22%（相对于实际计数），并且对于是否会发生事故的预测准确率高达 87% 以上（通过平均州统计）。通过多任务学习考虑州际变异性和迁移学习将交通量与事故预测相结合，取得这些结果。消融研究凸显了道路图结构特征的重要性。最后，讨论了分析的意义并开发了一个使用该数据集的便捷包。

Oct, 2023