提出一种无监督学习框架,利用未标记的数据来学习视频表示,通过学习推断不同视图的三维运动,捕捉视角不变的动作特征,以及增强视角不变特征的学习方法,并在多个数据集上证明该方法对动作识别的有效性。
Sep, 2018
本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法,通过 SVM 对特征进行分类,实验结果表明,在标准数据集上,该算法提高了 14% 的识别率。
Mar, 2017
本文分析基于 2D 或 3D CNN 的视频动作识别方法,比较这些方法之间的区别和进展,并开发了一个统一框架进行公平比较,发现在动作识别方面取得了显著的提高,但准确性未有进展,探究了 2D-CNN 与 3D-CNN 模型在时空表示能力和可传递性方面的相似之处。
Oct, 2020
该论文提供了一个从多个角度观测人类行为的数据集,并在两流卷积神经网络结构配合核排名汇总的方法下获得了 74.0% 的动作识别准确率。
Oct, 2021
通过利用 “提议(proposals)” 方法生成行为区域的模型训练,能够在无约束视频中实现人的行为识别,无论是否存在摄像头运动;该方法在两个新的数据集中取得了超越最先进技术的性能,同时在异常行为检测场景中取得较高的成功率。
Jan, 2017
本文综述了 200 多篇关于视频动作识别的深度学习论文,介绍了 17 个影响模型设计的数据集和深度学习模型的发展历程,包括深度学习适应、双流网络、3D 卷积核和计算效率模型,并对几种方法在典型数据集上进行了基准测试,最后,讨论了视频动作识别面临的问题和未来的研究机会。
Dec, 2020
本研究旨在探讨合成人类能否提高人类动作识别的性能,特别关注对不寻常拍摄视角的泛化能力,研究发现数据的合成和扩充可以带来性能的提升。
Dec, 2019
本篇论文提出了一种增强标准 I3D 网络的算法,通过添加跟踪模块和图卷积网络结构,将领域知识融入模型,并在活动行为检测中获得了更好的结果表现。
Dec, 2018
通过对深度学习模型的全面分析,这项研究揭示了卷积神经网络、循环神经网络和两流卷积神经网络在人体动作识别中的优势和性能差异,并强调了综合模型在实现强大的人体动作识别方面的潜力和优化的研究方向。
Mar, 2024
该研究提出了一种新的基于两个流的 3D 卷积神经网络体系结构,使用光流场序列处理红外图像,应用于红外动作识别(InfAR)数据集,实验结果表明我们的方法在 InfAR 数据集上可以获得最好的平均精度(AP)表现。
May, 2017