多层深度特征联合关注的动作识别
本文提出一种基于 soft attention 的模型,用于对视频中的动作进行识别,该模型使用多层循环神经网络 (RNNs) 和长短期记忆 (LSTM) 单元,学习有选择地专注于视频帧的某些部分,通过几个瞥见来对视频进行分类。该模型主要学习帧中哪些部分与目标任务相关,并赋予它们更高的重要性。我们在 UCF-11 (YouTube Action)、HMDB-51 和 Hollywood2 数据集上评估了该模型,并分析了模型在不同场景和不同动作下注意力的聚焦。
Nov, 2015
本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法,通过 SVM 对特征进行分类,实验结果表明,在标准数据集上,该算法提高了 14% 的识别率。
Mar, 2017
本文主要介绍了基于卷积神经网络和 LSTM 神经网络的动作识别方法,实验证明本文提出的多流融合模型可以有效地提高识别准确率。
Apr, 2017
采用多核支持向量机和多流深度卷积神经网络相结合的方法,在多个方面如摄像机视角、视频质量等具有挑战性的 HMDB-51 数据集上,实现了接近最先进技术的 51 种活动识别问题的性能,同时也表现出人类级别的视觉理解能力,并且结合了改进的稠密轨迹和多跳特征叠加等人工手工制造特征补充了性能。
Jul, 2017
本文提出了一种基于深度卷积神经网络的两通道 ConvNet 架构,结合了空间和时间网络,利用稀疏光流信息进行训练并使用多任务学习提高模型性能,成功地提高了视频动作识别的准确率。
Jun, 2014
通过对深度学习模型的全面分析,这项研究揭示了卷积神经网络、循环神经网络和两流卷积神经网络在人体动作识别中的优势和性能差异,并强调了综合模型在实现强大的人体动作识别方面的潜力和优化的研究方向。
Mar, 2024
本文介绍一种基于卷积神经网络的层级模型,用于动作识别任务。该模型采用最后一层卷积神经网络的输出特征作为基础,并设计了一个层级结构来捕获视频中的时间变化。同时,作者引入了一种用于提取视频关键帧的方法,从而提高了模型的性能表现。通过在多个动作数据集上的实验结果表明,该方法在动作识别任务上取得了优越的性能表现。
Dec, 2015
本文提出了一种介于 3D 卷积和 CNN 特征融合之间的方法,使用卷积结构学习适当的模式,同时保留了特征流,并检验了该方法在 TSN、TRN 和 ECO 模型上的效果。
May, 2019
该研究提出了一种利用卷积层激活函数形成判别视频描述符的方法,在身体关节位置的指引下对卷积层数上的特征进行聚合,从而提升视频识别的准确性,并使用双线性模型来使其端到端化和不依赖于任何复杂的身体关节检测算法。
Apr, 2017