可解释风险评估：GPT-4V 在关心安全的过马路中的应用

Feb, 2024

可解释风险评估：GPT-4V 在关心安全的过马路中的应用

Is it safe to cross? Interpretable Risk Assessment with GPT-4V for Safety-Aware Street Crossing

Hochul Hwang, Sunjae Kwon, Yekyung Kim, Donghyun Kim

TL;DR通过使用多模式模型解释复杂的街道交叉场景，为盲人和低视力人群提供安全评分和场景描述，支持他们进行安全决策。

Abstract

Safely navigating street intersections is a complex challenge for blind and low-vision individuals, as it requires a nuanced understanding of the surrounding context - a task heavily reliant on visual cues. Traditional methods for assisting in this decision-making process often fall sh

street intersections blind and low-vision individuals multimodal models safety score scene description

发现论文，激发创造

自主街道穿越的多模态交互感知运动预测

提出了一种基于多模态卷积神经网络框架来预测街道交叉口安全性的算法，通过将交通灯识别和交通参与者轨迹估计融合起来进行决策，实现了在交通信号化和未信号化的街道交叉口的安全导航，并在公共基准数据集和提案数据集上实现了最先进的结果。

Aug, 2018

GPT-4V 掌控方向：对行人行为预测的承诺和挑战评估

GPT-4V 在自动驾驶中利用公开可用的数据集 JAAD、PIE 和 WiDEVIEW 进行行人行为预测的评估，定量和定性评估证明了 GPT-4V 在零 - shot 行人行为预测和自动驾驶中的驾驶场景理解能力，但仍不及传统领域特定模型的最新成果，存在小行人和运动车辆处理困难等限制，需要进一步研究和发展。

Nov, 2023

VisionGPT: 基于 LLM 辅助的实时异常检测用于安全视觉导航

利用 Yolo-World 目标检测模型和专门的提示，本文探讨了大型语言模型（LLMs）在零样本异常检测中的潜力，实现了识别摄像头捕获帧中的异常并生成简洁的音频描述，从而在复杂环境中协助安全的视觉导航。此外，本文还探讨了不同提示组件的性能贡献，并为视觉辅助性的未来改进提供了展望，并为 LLMs 在视频异常检测和视觉语言理解方面铺平了道路。

Mar, 2024

AccidentGPT: 基于 V2X 环境感知的事故分析与预防的多模态大型模型

交通事故一直是交通安全领域的研究重点，然而以往的研究往往孤立进行，缺少综合性的交通安全分析与预防框架。为了填补这一空白，本研究引入了 AccidentGPT，这是一个综合事故分析和预防的多模态大型模型，通过多传感器感知提供全面的事故分析和预防方法，支持自动驾驶车辆、人驾驶车辆和交通管理机构的安全需求。该模型首次将全面场景理解融入交通安全研究。

Dec, 2023

自主轮椅的安全过马路：一种新型数据集及其实验评估

自动驾驶车辆的安全过马路是智能城市中需要解决的重要问题。本文介绍了一种多传感器融合方法，用于支持由自主轮椅和具备多样化和冗余组件的飞行无人机组成的系统中的过马路决策。为此，我们设计了一个基于可解释的物理条件的分析危险函数，通过单个传感器评估这些条件，其中包括使用机器学习和视觉技术的传感器。作为概念证明，我们在实验室环境中进行了实验评估，展示了使用多个传感器的优势，这可以提高决策准确性并有效支持安全评估。我们将数据集提供给了科学界，以进行进一步的实验。这项工作是在一项名为 REXASI-PRO 的欧洲项目的框架下开展的，该项目旨在为行动不便的人们的社交导航开发可信赖的人工智能。

Mar, 2024

基于多模式大型语言模型的交通安全关键事件自动检测

利用多模态大语言模型对自动驾驶视频进行自动分析，以提高安全性和可靠性，确保准确、可靠和可操作的危险检测，并改善安全事件检测和复杂环境交互的理解。

Jun, 2024

GPT-4V 作为交通助手：对复杂交通事件的视觉语言模型的深入研究

通过使用 GPT-4V 对代表性交通事件视频进行实验，我们发现 GPT-4V 在某些经典交通事件中展现出了出色的认知、推理和决策能力，同时也发现了它在更复杂场景中的理解存在一定限制，这些限制值得进一步探索和解决。

Feb, 2024

利用关联局部动态地图的遮挡风险交叉警告系统

本文介绍了一种用于交通场景风险评估的方法，主要关注可视性受限的路口场景。通过使用局部动态地图进行光线投射以获得视野区域，识别存在潜在风险的场景实体并进行碰撞风险评估，得出用于评估驾驶人行为的风险指标，并通过实际场景验证其有效性。

Mar, 2023

GPT-4V (ision) 自动驾驶中的视觉语言模型的早期探索

该研究论文评估了最新的先进视觉语言模型（VLM）在自动驾驶场景中的应用，发现该模型在场景理解和因果推理方面表现出优越性能，但在方向辨别、交通信号识别、视觉对接以及空间推理任务方面仍存在挑战。

Nov, 2023

基于预测侵占后时间的非信号化交叉口行人潜在风险实时评估框架

在交通研究领域，解决路口行人安全问题是一项重要的任务。本文通过发展实时主动保护系统，利用计算机视觉技术和预测模型，以基于预测的行人潜在风险评估为核心，解决了当前实时行人风险评估研究面临的三个主要挑战，提出了一种新的安全衡量标准，Predicted Post-Encroachment Time (P-PET)，并将行人划分为不同类别以应用特定评估准则，改进了风险评估的效果和可靠性。

Apr, 2024