Oct, 2023

视觉推理与驾驶危险预测相遇:问题形式化及数据集

TL;DR本研究旨在通过借助汽车行车记录仪的单个图像,对驾驶中可能遇到的危险进行预测。为了开展这一不常研究的领域,我们创造了一个名为 DHPR 的数据集,其中包含 15K 个街景图像,每张图像都与车速、假设的危险描述和场景中的可见实体相关联。通过评估基线方法在数据集上的表现,我们发现仍存在问题,并讨论了未来的方向。本研究通过引入新的问题形式和数据集,为驾驶危险预测领域做出了贡献,让研究人员能够探索多模态人工智能在此领域的潜力。