Apr, 2024

揭示什么、为何以及如何:视频异常因果理解的综合基准

TL;DR视频异常理解(VAU)研究旨在自动理解视频中的异常事件,从而实现交通监控和工业制造等各种应用。本研究提出了一种综合基准测试框架——视频异常因果关系理解(CUVA),能够回答“发生了什么异常事件?”,“为什么会发生?”,以及“这种异常事件有多严重?”这几个关键问题。针对CUVA,还引入了一种新的评估指标MMEval,该指标更好地与人类偏好相一致,有助于衡量现有语言模型在理解视频异常的原因和影响方面的表现。最后,本研究提出了一种基于提示的方法作为CUVA的基线方法,并进行了大量实验证明评估指标和基线方法的优越性。