May, 2023

交通视频中异常检测的音视频数据集和方法

TL;DR介绍了第一个用于真实场景交通异常检测的音频 - 视觉数据集 MAVAD,并提出了一种名为 AVACA 的新方法,它通过交叉注意提取视频序列中的视觉和音频特征来检测异常。演示了音频的加入将 AVACA 方法提高了 5.2%的性能,并评估了图像匿名化的影响,结果表明此影响仅对性能平均下降 1.7%。