通过去噪分数匹配实现多尺度对数密度估计的视频异常检测

Mar, 2024

通过去噪分数匹配实现多尺度对数密度估计的视频异常检测

MULDE: Multiscale Log-Density Estimation via Denoising Score Matching for Video Anomaly Detection

Jakub Micorek, Horst Possegger, Dominik Narnhofer, Horst Bischof, Mateusz Kozinski

TL;DR我们提出了一种新颖的视频异常检测方法：将从视频中提取的特征向量视为固定分布的随机变量的实现，并用神经网络对该分布进行建模，以便估计测试视频的可能性并通过阈值法检测视频异常。我们使用一种改进的去噪得分匹配方法来训练视频异常检测器，该方法通过向训练数据注入噪声来便于模型其分布。为了消除超参数选择，我们对不同噪声水平下的噪声视频特征的分布进行建模，并引入一种倾向于使不同噪声水平的模型保持一致的正则化器。在测试时，我们使用高斯混合模型将多个噪声尺度下的异常指示组合起来。我们的视频异常检测器运行时延最小，因为推理仅需要提取特征并将其通过浅层神经网络和高斯混合模型进行前向传播。我们对五个常用视频异常检测基准进行的实验表明，在面向对象和面向帧的设置下，我们的方法表现卓越。

Abstract

We propose a novel approach to video anomaly detection: we treat feature vectors extracted from videos as realizations of a random variable with a fixed distribution and model this distribution with a neural network

video anomaly detection feature vectors neural network denoising score matching gaussian mixture model

发现论文，激发创造

大规模视频异常检测的判别式框架

本文提出了一种基于判别式学习的异常检测框架，其独立于时间顺序和无监督，无需额外的训练序列，并且在移除了标准数据集中的训练序列后，仍能取得最先进的结果。

Sep, 2016

监控视频中的现实世界异常检测

该论文提出了一种通过深度多实例评级框架利用弱标记训练视频来学习异常的方法，并介绍了一个包括正常和异常视频的新型数据集，该数据集用于一般的异常检测和 13 个异常活动的识别任务。实验结果表明该方法显著提高了异常检测的性能。

Jan, 2018

增强结构化分布学习的非线性降噪得分匹配

提出了一种新颖的训练基于分数的生成模型的方法，通过非线性加噪动力学改进结构化分布的学习，从而使其更好地适应数据，在数据预处理步骤中获取结构并引入了两种方法解决非线性动力学训练带来的挑战，展示了该方法在几个示例上的有效性。

May, 2024

D3AD：动态去噪扩散概率模型用于异常检测

扩展前述的隐式条件方法，我们提出了一种新的框架，通过动态步长计算、无噪声缩放输入和潜在空间投影的方式增强了扩散模型的能力，有效地定位异常并在两个著名异常检测数据集上取得了最先进的性能。

Jan, 2024

高斯混合全卷积变分自编码器实现视频异常检测和定位

提出了一种部分有监督的深度学习方法，用于视频异常检测和定位，其中使用的仅为正常样本，并且该方法基于使用深度学习训练的高斯混合模型，可以学习正常样本的特征表示。通过使用 RGB 帧和动态流图像，同时使用出现和运动异常构建了一个双流网络框架，并基于高斯混合分量的联合概率引入了一种基于样本能量的方法来评分图像测试块的异常。在 UCSD 数据集和 Avenue 数据集上进行了测试实验，结果表明，与现有技术相比，该方法具有卓越的性能。

May, 2018

通过中心引导的判别学习实现弱监督视频异常检测

该论文提出了一种基于弱监督学习的异常检测框架 AR-Net，并通过动态多实例学习和中心损失设计了具有较强鉴别特征的回归模型，实现了对监控视频异常的检测，并在 ShanghaiTech 数据集上取得了最新的最好成果。

Apr, 2021

利用聚类辅助异物检测视频的弱监督训练

我们提出了一种弱监督的异常检测系统，包括一个随机批处理选择机制、一个正常区域抑制块和一个聚类损失块，以利用训练批次中的总体信息，降低标签噪声并提高特征表示学习，以及通过三个数据集的实验证明了我们方法的卓越的异常检测能力。

Mar, 2022

多元高斯图像异常检测可视化

本文介绍了 PaDiM 方法的简化，使用单变量高斯分布拟合从卷积神经网络中提取的特征向量，将它们的马氏距离作为异常值评分，并通过执行白化转换生成能够可视化 MVG 学到特征的热图，MVTec-AD 数据集的实验结果表明，视觉模型验证的重要性，提供了这个框架中，本来无法察觉的问题的见解。本文生成的可视化结果可以通过公开链接获得。

Jul, 2023

基于多尺度时域特征的动态擦除网络用于弱监督视频异常检测

弱监督视频异常检测中，提出了一种动态擦除网络（DE-Net），能够学习多尺度时空特征，处理异常事件时长变化并评估异常检测的完整性。该方法在 XD-Violence、TAD 和 UCF-Crime 三个数据集上表现良好。

Dec, 2023

无监督基于坐标的视频去噪

本文介绍了一种新颖的无监督视频去噪深度学习方法，可帮助减轻数据稀缺问题并展现对不同噪声模式的稳健性，其方法包括三个模块：生成特征图的特征生成器、生成去噪但略带模糊的参考帧的去噪网络、重新引入高频细节的改进网络。通过利用基于坐标的网络，可以在保留去噪视频帧中高频细节的同时大大简化网络结构。广泛的试验表明，我们的方法可以有效地去噪现实中的钙成像视频序列，而无需先验知识和数据增强训练。

Jul, 2023