ICCVJul, 2023

AIDE: 一种以视觉为驱动的多视角、多模态、多任务辅助驾驶数据集

TL;DR过去十年来,司机分心成为严重交通事故的一个重要原因。本文介绍了一个考虑车内外背景信息的辅助驾驶感知数据集(AIDE),该数据集通过三个特征实现了全面的驾驶员监测,包括驾驶员和场景的多视角设置、对面部、身体、姿势和手势进行多模态注释,以及四种用于驾驶理解的实用任务设计。通过广泛的方法,在三种基准框架上提供了对 AIDE 的实验基准。此外,介绍了两种融合策略,以深入研究学习有效的多流 / 模态表示的新见解。同时,还系统地调查了 AIDE 和基准中关键组件的重要性和合理性。项目链接见 https URL。