基于卷积长短时记忆预测网络的视频异常检测
本文提出了一个基于深度学习神经网络的方法来自动识别监控视频中的暴力行为,具有很高的识别精度。该方法采用卷积神经网络和长短时记忆网络,能够捕捉到视频中局部的时空特征,实现对局部运动的分析,并通过对相邻帧的差异计算来增强所提出方法的识别功能。实验证明,该方法表现优于现有的同类方法,具有广泛的研究价值。
Sep, 2017
本文提出了一种实时的基于神经网络学习和特征操作的集体异常检测模型,该模型训练了一个 LSTM 循环神经网络来侦测网络数据的集体异常,实验结果表明该模型能够提供可靠和高效的集体异常检测方案。
Mar, 2017
本文提出了一种针对视频进行自动化重点帧或子镜头选择的新型监督学习技术,其将问题视为顺序数据上的结构化预测问题,主要想法是利用 LSTM(长短时记忆),该专用网络类型可模拟视频摘要任务中包含的可变范围依赖性,详细分析证明了模型设计的合理性,通过引入领域适应技术,我们还介绍了应对训练复杂学习模型所需大量注释数据需求的技术。
May, 2016
本文提出了一种基于无监督学习的异常检测方法,其中使用内存模块记录正常数据的原型模式,并提出了新的特征紧凑性和分离性损失来训练内存以提高区分能力和识别准确性。该方法在标准基准测试中表现良好,优于现有技术。
Mar, 2020
L2STM 是一种通过学习独立的隐藏状态转移来增强模型的时间动力学建模能力以及解决长期时间动态不稳定的问题的方法,结合多模态训练程序,在人类动作识别方面表现优于现有的基于 LSTM 和 / 或 CNN 的方法。
Aug, 2017
本研究提出了一种基于生成模型和 ConvLSTM 的新型顺序生成模型,用于预测未来视频帧,并在异常检测框架中考虑时间信息,实验表明,该方法在三个基准数据集上优于现有最先进方法。
Sep, 2019
本论文提出和评估了几个深度神经网络架构,用于对比以往更长时间段内视频图像信息的组合。通过一些新的方法,包括卷积时间特征池化和循环神经网络结构,该论文指出最佳神经网络在 Sports 1 million 数据集(73.1%对 60.9%)和 UCF-101 数据集中(88.6%对 88.0%)及无附加光流信息(82.6%对 72.8%)上明显性能提高。
Mar, 2015
本文基于 YouTube-8M 大规模数据集,提出了三种视频分类模型,分别基于帧池化和 LSTM 网络,第三个模型使用 Experts 混合中间层以增加模型容量,并进行了一系列处理不平衡训练数据的实验。
Jun, 2017
使用多层 LSTM 网络来学习视频序列的表示,采用编码器 LSTM 将输入序列映射成固定长度的表示,通过单个或多个解码器 LSTM 解码以执行不同的任务,如重构输入序列或预测未来序列,实验说明预先训练好的模型在人类动作识别等任务上的有效性。
Feb, 2015
研究比较深度卷积网络和带有循环结构的深度卷积神经网络的效果,针对视频识别、图像描述、检索以及视频叙事方面的问题,开发出一种新颖的循环卷积架构,该架构可以训练端到端,可以同时学习时间动态和卷积感知表示,并具有学习长期依赖性的能力。实验结果证明,循环卷积模型在识别或生成方面与现有的模型相比具有明显的优势。
Nov, 2014