基于紧凑运动表示条件下的非监督视频异常检测
本研究探究了扩散模型在不使用数据注释的情况下,用于视频异常检测的性能。实验结果表明,该方法优于现有的生成模型,并且是第一项使用扩散模型并研究其参数影响的研究。
Apr, 2023
该研究提出一种基于生成模型的视频异常检测方法,利用骨骼表示和扩散概率模型生成多模态人体姿势,并通过统计聚合的未来模态检测异常,其在四个基准测试中均取得优于现有技术的表现。
Jul, 2023
通过使用预先训练的潜在扩散模型修复被屏蔽区域图像,并进一步通过混合来扰动光流以产生时间空间扭曲,提出了一种新的生成通用时空伪异常的方法。此外,通过学习重建质量、时间不规则性和语义不一致性等三种异常指标的简单统一框架,在开放集识别任务下检测现实世界的异常。在 Ped2、Avenue、ShanghaiTech 和 UBnormal 四个 VAD 基准数据集上进行了大量实验,证明我们的方法在 OCC 设置下的性能与其他现有的基于伪异常生成和重建的方法相当。同时我们的分析还检验了伪异常在这些数据集之间的可转移性和普适性,通过识别伪异常从而发现现实世界的异常提供了有价值的见解。
Nov, 2023
该研究提出了一种新的两流对象感知 VAD 方法,通过图像转换任务学习正常的外观和动态模式,检测偏离学习正常模式的异常情况,并在三个数据集上表现有竞争力。
May, 2022
本文提出 DDAD,一种新的基于去噪扩散的异常检测方法,其中包括图像重建的新型去噪过程、利用生成样例细调特征提取器的域适应方法等,通过在多个数据集上的测试验证了其优越性能。
May, 2023
视频异常检测(VAD)在现代监控系统中扮演着关键角色,旨在识别真实情境中的各种异常。然而,当前基准数据集主要强调简单的单帧异常,如新颖物体检测,这种狭窄的焦点限制了 VAD 模型的进展。在这项研究中,我们主张扩展 VAD 研究,涵盖超越传统基准范围的复杂异常。为此,我们引入了两个数据集:HMDB-AD 和 HMDB-Violence,以挑战具有多样化基于动作的异常的模型。这些数据集源于 HMDB51 动作识别数据集。我们进一步介绍了一种新方法 Multi-Frame Anomaly Detection(MFAD),它建立在 AI-VAD 框架之上。AI-VAD 利用单帧特征,如姿势估计和深度图像编码,以及双帧特征,如物体速度。然后,他们应用密度估计算法计算异常分数。为了解决复杂的多帧异常,我们添加了捕捉长期时态依赖性的深度视频编码特征和逻辑回归以增强最终分数计算。实验结果证实了我们的假设,并突显出现有模型对新异常类型的限制。在简单和复杂的异常检测场景中,MFAD 表现出色。
Oct, 2023
扩展前述的隐式条件方法,我们提出了一种新的框架,通过动态步长计算、无噪声缩放输入和潜在空间投影的方式增强了扩散模型的能力,有效地定位异常并在两个著名异常检测数据集上取得了最先进的性能。
Jan, 2024
通过将初始和未来的原始帧替换为相应的语义分割地图,我们引入了从单帧进行未来视频预测的代理任务,以克服以往方法在学习更长动态模式方面的挑战,并展示了该方法在基准数据集上的有效性和优越性。
Aug, 2023
该研究提出基于扩散模型的视频生成方法,通过隐式条件建模来模拟运动效果,并提出多种策略来优化生成视频的质量。实验证明,该方法在 FVD 得分和视觉质量方面明显优于现有的以生成对抗网络为基础的方法。
Dec, 2022
基于骨骼的视频异常检测是计算机视觉中关键的任务,在准确识别异常模式或事件方面可以帮助操作员及时发现可疑活动,从而增强安全性。本文介绍了一种新颖、实用且轻量级的框架,名为基于图拼图条件扩散模型的基于骨骼的视频异常检测(GiCiSAD),以应对与 SVAD 相关的挑战。GiCiSAD 包括三个新颖模块:基于图注意力的预测模块,用于捕捉数据中固有的时空依赖性;基于图层级的拼图制作模块,用于区分正常和异常运动之间的细微区域差异;以及基于图的条件扩散模型,用于生成广泛的人体动作。对四个广泛使用的基于骨骼的视频数据集进行的大量实验证明,GiCiSAD 在具有显著更少的训练参数的情况下优于现有方法,成为新的最先进技术。
Mar, 2024