探究无监督视频异常检测的扩散模型
本文提出了一种利用条件扩散模型进行无监督视频异常检测的方法,使用预训练网络提取空间和时间特征,并结合能概括给定视频片段运动和外观的紧凑运动表示进行条件约束,采用数据驱动的阈值,将高重构误差视为异常事件的指标。实验表明,该方法在大规模视频异常检测数据集上的性能优于现有方法和基线方法。
Jul, 2023
通过引入合成异常样本和空间自适应特征融合方案,本文提出了一种全局和局部自适应扩散模型(GLAD)用于无监督异常检测,增加了灵活性并实现了无异常的重构,同时保留了尽可能多的正常信息。
Jun, 2024
扩展前述的隐式条件方法,我们提出了一种新的框架,通过动态步长计算、无噪声缩放输入和潜在空间投影的方式增强了扩散模型的能力,有效地定位异常并在两个著名异常检测数据集上取得了最先进的性能。
Jan, 2024
通过使用预先训练的潜在扩散模型修复被屏蔽区域图像,并进一步通过混合来扰动光流以产生时间空间扭曲,提出了一种新的生成通用时空伪异常的方法。此外,通过学习重建质量、时间不规则性和语义不一致性等三种异常指标的简单统一框架,在开放集识别任务下检测现实世界的异常。在 Ped2、Avenue、ShanghaiTech 和 UBnormal 四个 VAD 基准数据集上进行了大量实验,证明我们的方法在 OCC 设置下的性能与其他现有的基于伪异常生成和重建的方法相当。同时我们的分析还检验了伪异常在这些数据集之间的可转移性和普适性,通过识别伪异常从而发现现实世界的异常提供了有价值的见解。
Nov, 2023
该研究提出一种基于生成模型的视频异常检测方法,利用骨骼表示和扩散概率模型生成多模态人体姿势,并通过统计聚合的未来模态检测异常,其在四个基准测试中均取得优于现有技术的表现。
Jul, 2023
提出了一种基于扩散的少样本异常生成模型,利用大规模数据集中学习到的潜在扩散模型的强优先信息,增强生成的真实性,并通过创新的自适应注意力重新加权机制提高生成异常图像和异常遮罩之间的对齐,实现了准确匹配的异常图像 - 遮罩对,从而显著提高异常检测任务的性能。
Dec, 2023
通过深度学习方法的视频异常检测(VAD)调查,本篇综述探索了传统监督训练范式之外的新兴弱监督、自监督和无监督方法,研究了 VAD 范式中的核心挑战,以及视觉语言模型(VLMs)作为强大的特征提取器在 VAD 中的作用,旨在增强复杂现实场景中异常检测的鲁棒性和效率,并填补现有知识差距,为研究人员提供有价值的见解,为 VAD 研究的未来贡献力量。
May, 2024
该研究探讨了扩散模型在无监督和半监督异常检测中的应用,并在相应的基准测试中表现出了出色的性能,特别是在 DTPM 中,使用深度神经网络提高推断效率,获得了比 DDPM 更快的推理时间和更好的性能。
May, 2023
视频异常检测(VAD)在现代监控系统中扮演着关键角色,旨在识别真实情境中的各种异常。然而,当前基准数据集主要强调简单的单帧异常,如新颖物体检测,这种狭窄的焦点限制了 VAD 模型的进展。在这项研究中,我们主张扩展 VAD 研究,涵盖超越传统基准范围的复杂异常。为此,我们引入了两个数据集:HMDB-AD 和 HMDB-Violence,以挑战具有多样化基于动作的异常的模型。这些数据集源于 HMDB51 动作识别数据集。我们进一步介绍了一种新方法 Multi-Frame Anomaly Detection(MFAD),它建立在 AI-VAD 框架之上。AI-VAD 利用单帧特征,如姿势估计和深度图像编码,以及双帧特征,如物体速度。然后,他们应用密度估计算法计算异常分数。为了解决复杂的多帧异常,我们添加了捕捉长期时态依赖性的深度视频编码特征和逻辑回归以增强最终分数计算。实验结果证实了我们的假设,并突显出现有模型对新异常类型的限制。在简单和复杂的异常检测场景中,MFAD 表现出色。
Oct, 2023