单帧未来视频预测用于视频异常检测
该论文提出了一种在视频预测框架内解决异常检测问题的方法,利用预测未来画面与真实画面之间的差异来检测异常事件,并引入了空间和运动约束来促进正常事件的未来帧预测和识别不符合预期的异常事件。
Dec, 2017
提出了一种基于帧预测的视频异常检测方法,该方法采用了 Multi-path ConvGRU 网络以更好地处理语义信息对象和不同尺度的区域,并在训练期间引入了噪声容忍损失来减轻背景噪声造成的干扰,经过对 CUHK Avenue、ShanghaiTech Campus 和 UCSD Pedestrian 数据集进行了广泛的实验,并获得了比现有技术方法更好的表现,尤其是在 CUHK Avenue 数据集上,获得了 88.3%的帧级 AUROC 分数。
Nov, 2020
该研究提出了一种新的两流对象感知 VAD 方法,通过图像转换任务学习正常的外观和动态模式,检测偏离学习正常模式的异常情况,并在三个数据集上表现有竞争力。
May, 2022
本研究提出了一种基于生成模型和 ConvLSTM 的新型顺序生成模型,用于预测未来视频帧,并在异常检测框架中考虑时间信息,实验表明,该方法在三个基准数据集上优于现有最先进方法。
Sep, 2019
通过使用预先训练的潜在扩散模型修复被屏蔽区域图像,并进一步通过混合来扰动光流以产生时间空间扭曲,提出了一种新的生成通用时空伪异常的方法。此外,通过学习重建质量、时间不规则性和语义不一致性等三种异常指标的简单统一框架,在开放集识别任务下检测现实世界的异常。在 Ped2、Avenue、ShanghaiTech 和 UBnormal 四个 VAD 基准数据集上进行了大量实验,证明我们的方法在 OCC 设置下的性能与其他现有的基于伪异常生成和重建的方法相当。同时我们的分析还检验了伪异常在这些数据集之间的可转移性和普适性,通过识别伪异常从而发现现实世界的异常提供了有价值的见解。
Nov, 2023
通过深度学习方法的视频异常检测(VAD)调查,本篇综述探索了传统监督训练范式之外的新兴弱监督、自监督和无监督方法,研究了 VAD 范式中的核心挑战,以及视觉语言模型(VLMs)作为强大的特征提取器在 VAD 中的作用,旨在增强复杂现实场景中异常检测的鲁棒性和效率,并填补现有知识差距,为研究人员提供有价值的见解,为 VAD 研究的未来贡献力量。
May, 2024
视频异常检测(VAD)在现代监控系统中扮演着关键角色,旨在识别真实情境中的各种异常。然而,当前基准数据集主要强调简单的单帧异常,如新颖物体检测,这种狭窄的焦点限制了 VAD 模型的进展。在这项研究中,我们主张扩展 VAD 研究,涵盖超越传统基准范围的复杂异常。为此,我们引入了两个数据集:HMDB-AD 和 HMDB-Violence,以挑战具有多样化基于动作的异常的模型。这些数据集源于 HMDB51 动作识别数据集。我们进一步介绍了一种新方法 Multi-Frame Anomaly Detection(MFAD),它建立在 AI-VAD 框架之上。AI-VAD 利用单帧特征,如姿势估计和深度图像编码,以及双帧特征,如物体速度。然后,他们应用密度估计算法计算异常分数。为了解决复杂的多帧异常,我们添加了捕捉长期时态依赖性的深度视频编码特征和逻辑回归以增强最终分数计算。实验结果证实了我们的假设,并突显出现有模型对新异常类型的限制。在简单和复杂的异常检测场景中,MFAD 表现出色。
Oct, 2023
在智能视频监控中,视频异常检测 (VAD) 涉及检测视频中的异常事件,这是一个复杂而重要的任务。本文提出了一种基于先验知识引导的网络 (PKG-Net) 来解决 VAD 任务。通过在教师 - 学生架构中将自编码器网络与两个指定的代理任务相结合,即未来帧预测和教师网络模仿,提供了更好的未知样本泛化能力。此外,还提出了对适当特征块进行知识蒸馏,以增加模型的多尺度检测能力。实验结果在三个公开基准上验证了我们方法的有效性和准确性,超过了最近的最先进方法。
Sep, 2023
通过多任务学习方法结合异构特征检测,我们提出了一种视频异常检测方法,综合考虑了运动和外观特征,其中包括语义分割和未来帧预测任务来学习目标类和一致的运动模式,同时添加了多种注意机制来检测运动反常,并优于现有方法。
Oct, 2022
通过自监督学习和视觉变换网络,提出一种用于视频异常检测的方法,能够有效地保留视频帧的空间和时间上的一致性,并且在三个公共基准测试中表现优于像素生成方法和其他自监督学习方法。
Mar, 2024