弱监督视频异常检测中具有正常性指导的文本提示

CVPRApr, 2024

弱监督视频异常检测中具有正常性指导的文本提示

Text Prompt with Normality Guidance for Weakly Supervised Video Anomaly Detection

Zhiwei Yang, Jing Liu, Peng Wu

TL;DR基于文本提示和正常性指导的弱监督视频异常检测方法通过生成伪标签和自适应学习来提高性能。

Abstract

weakly supervised video anomaly detection (WSVAD) is a challenging task. Generating fine-grained pseudo-labels based on weak-label and then self-training a classifier is currently a promising solution. However, since the existing methods use only RGB visual modality and the utilization

weakly supervised video anomaly detection pseudo-label generation self-training framework text prompt with normality guidance temporal context self-adaptive learning

发现论文，激发创造

从事件提示中学习视频异常检测中的疑似异常

提出了一种用于弱监督视频异常检测的新颖框架，通过计算潜在异常事件的文本提示词典与异常视频生成的字幕之间的语义异常相似性，标识每个视频片段的疑似异常事件，并通过多提示学习过程约束所有视频的视觉 - 语义特征，提供了一种为自训练标记伪异常的新方法。通过全面实验和详细消融研究，在四个数据集（XD-Violence、UCF-Crime、TAD、ShanghaiTech）上表现出优于大多数最先进方法的性能（82.6%，87.7%，93.1% 和 97.4%），并在开放集和跨数据集情况下展示了有希望的性能。

Mar, 2024

VadCLIP: 适应弱监督视频异常检测的视觉语言模型

通过直接利用对比式语言 - 图像预训练模型 (CLIP) 在视频领域的强大表示能力和设计鲁棒的视频异常检测器，本文提出了 VadCLIP，一种弱监督视频异常检测范例，无需预训练和微调过程，通过双分支实现粗粒度和细粒度的视频异常检测，实验结果在两个常用基准上表现出色，超越了目前其他方法一大截。

Aug, 2023

利用聚类辅助异物检测视频的弱监督训练

我们提出了一种弱监督的异常检测系统，包括一个随机批处理选择机制、一个正常区域抑制块和一个聚类损失块，以利用训练批次中的总体信息，降低标签噪声并提高特征表示学习，以及通过三个数据集的实验证明了我们方法的卓越的异常检测能力。

Mar, 2022

CLAWS: 利用聚类辅助弱监督学习和正常行为抑制进行异常事件检测

本文提出了一种弱监督异常检测方法，该方法包括基于随机批量的训练过程、正常状态抑制机制、聚类距离损失等贡献，其中通过将模型生成的不同的正常和异常聚类，降低标签噪音并生成更好的异常表示。该方法在 UCF Crime 和 ShanghaiTech 数据集上获得了 83.03% 和 89.67% 的逐帧 AUC 性能，证明了其优于现有先进算法的优越性。

Nov, 2020

PromptAD: 使用普通样本学习提示的少样本异常检测

提出了一种用于少样本异常检测的单类提示学习方法 PromptAD，在语义拼接和明确异常边界的基础上，通过自动学习提示来改进工业异常检测任务。在 MVTec 和 VisA 数据集的 11/12 个 few-shot 环境中，PromptAD 在图像级 / 像素级异常检测中取得第一名。

Apr, 2024

基于 BatchNorm 的弱监督视频异常检测

在弱监督视频异常检测（WVAD）中，我们提出了一种新方法 BN-WVAD，它将 BatchNorm 技术应用于 WVAD 中，利用来自 BatchNorm 的均值向量差异（DFM）作为可靠的异常判据来区分异常视频中的潜在异常片段，并且使用 DFM 作为额外的异常分数修正对异常分类器的预测，同时设计了一种批级选择策略以过滤更多异常片段，实验结果表明，BN-WVAD 模型在 UCF-Crime 数据集上达到了 87.24% 的 AUC，在 XD-Violence 数据集上达到了 84.93% 的 AP。

Nov, 2023

从弱标记视频中定位异常

本文提出了一种弱监督异常定位方法，利用高阶上下文编码模型提取语义表示，度量动态变化并有效利用时间上下文，通过聚合动态变量和立即语义来获取最终的异常分数，并通过增强策略处理噪声干扰和异常检测中的定位指导缺失，同时收集了一组新的交通异常数据集（TAD），实验表明该方法在常见的异常检测基准测试集中实现了最新的最佳性能。

Aug, 2020

监控视频中基于弱监督的时空异常检测

本文提出了一种被称为弱监督时空异常检测的新任务，针对监控视频的异常情况进行定位。我们提出了一种双分支网络方法，能够在时空域中使用多粒度的 proposals 进行关系推理，以捕捉目标行为的丰富上下文信息和复杂实体关系。并且在两个数据集上进行了广泛的定量和定性评估，证明了所提方法的有效性。

Aug, 2021

基于片段异常关注的弱监督视频异常检测

通过提出基于异常注意力的弱监督异常检测方法，该研究在涉及未剪辑视频中的异常事件方面表明了提取关键特征的有效性，并通过多分支监督模块进一步优化视频的异常检测和定位。

Sep, 2023

从文本查询中弱监督的视频片段检索

本文提出了一种学习弱标签的方法来解决文本 - 视频片段检索问题，并使用基于文本引导的注意力机制学习视频中的相关片段，该方法在两个基准数据集上获得了与监督式学习方法相当的性能。

Apr, 2019