Jun, 2024

VANE-Bench: 用于会话式 LMM 的视频异常评估基准

TL;DR这篇论文介绍了一种用于评估多模态视频模型在异常检测任务中的能力的基准测试方法 VANE-Bench。我们使用合成数据和真实世界样本,评估了九种不同的视频模型在检测和定位视频中的异常情况方面的表现,并发现大部分模型在准确识别微妙异常方面存在困难。此研究为多模态视频模型在异常检测领域的当前能力提供了重要见解,并强调了我们的工作在评估和改进这些模型以用于实际应用中的重要性。