本文提出了一种基于对象层面的自监督和多任务学习来检测视频中的异常事件的方法,结合多个代理任务进行学习,包括三个自监督任务和一个基于知识蒸馏的任务,并在三个基准测试中优于现有技术。
Nov, 2020
视频异常检测中,除了视觉信号外,我们还应用了骨架序列。我们提出了一种完整的骨架轨迹表示方法,以学习不同时间段内预期的动作。我们使用多任务学习来重建轨迹的任何未观测连续时间段,从而实现过去或未来时间段的外推和插值。我们采用了端到端的基于注意力的编码器 - 解码器模型,并对轨迹进行编码,联合学习被时间遮挡的轨迹段的潜在表示,并根据不同时间段内的预期动作进行重建。在三个基于轨迹的视频异常检测数据集上进行的大量实验证明了我们方法的优势和有效性,并在骨架轨迹的异常检测中取得了最先进的结果。
Nov, 2023
通过将初始和未来的原始帧替换为相应的语义分割地图,我们引入了从单帧进行未来视频预测的代理任务,以克服以往方法在学习更长动态模式方面的挑战,并展示了该方法在基准数据集上的有效性和优越性。
Aug, 2023
通过提出一种时间性增强的网络模型,学习一种能感知运动的特征,并通过多示例学习进行分类,从而在 UCF Crime 数据集上显著超越以往方法,在视频反常检测和异常行为识别任务上取得了较好的表现。
Jul, 2019
该研究提出了一种新的两流对象感知 VAD 方法,通过图像转换任务学习正常的外观和动态模式,检测偏离学习正常模式的异常情况,并在三个数据集上表现有竞争力。
May, 2022
本文提出了一种增强空间 - 时间记忆的双流自编码器框架,通过对抗学习,学习外观正常性和运动正常性,并探索空间和时间模式之间的相关性,在 UCSD Ped2 和 CUHK Avenue 数据集上,该框架的 AUC 分别为 98.1%和 89.8%,胜过最先进的方法。
Jul, 2022
提出了一种基于帧预测的视频异常检测方法,该方法采用了 Multi-path ConvGRU 网络以更好地处理语义信息对象和不同尺度的区域,并在训练期间引入了噪声容忍损失来减轻背景噪声造成的干扰,经过对 CUHK Avenue、ShanghaiTech Campus 和 UCSD Pedestrian 数据集进行了广泛的实验,并获得了比现有技术方法更好的表现,尤其是在 CUHK Avenue 数据集上,获得了 88.3%的帧级 AUROC 分数。
我们提出了一种深度卷积神经网络来检测监控视频中的异常事件,该网络通过学习一种物体外观和运动之间的关系来解决该问题。我们的模型是由重建网络和图像转换模型组成的,它们共享相同的编码器。该模型仅通过正常事件的视频进行训练,可对未知输入进行帧级别的评分。在 6 个基准数据集上的实验证明了该方法在与最先进方法的竞争性能方面的优越性。
Aug, 2019
提出了一种称为 “Tracking-by-Animation” 的跟踪框架,通过利用可微分的神经模型对多个对象进行跟踪,并在重构帧中动画化这些对象,从而实现了无需标记数据的端到端 MOT 学习。同时进一步提出了优化数据关联的 “Reprioritized Attentive Tracking” 模型。
Sep, 2018
该论文提出了一种轻量级视频异常检测模型,通过采用自适应实例选择策略和轻量级多级时间相关注意力模块,减少了模型参数,提高了模型性能,可在资源受限的情况下进行广泛部署。
Oct, 2023