人类动作识别的慢特征分析
通过构建表达力强的组合行为模型,模拟视频中动作实例的时空组合,采用弱监督学习算法,识别行为的潜在结构,最终实验结果表明该方法在动作识别方面的表现优于竞争方法。
Feb, 2015
该研究提出了一种利用稀疏编码技术进行基于类别的视频动作识别的方法,其中包括对代表性原子动作行为或关键序列进行分解的新方法和利用比较推理来捕捉关键序列之间相对相似性关系的新视频描述符ITRA,其在多个基准数据集上表现出色,优于其他最先进技术。
May, 2016
本文探讨了基于骨架数据的人类动作识别领域研究现状,提出了一种将核方法和神经网络结合的浅层网络方法,并通过多个公开数据集验证了这种方法的有效性。
Aug, 2017
L2STM是一种通过学习独立的隐藏状态转移来增强模型的时间动力学建模能力以及解决长期时间动态不稳定的问题的方法,结合多模态训练程序,在人类动作识别方面表现优于现有的基于LSTM和/或CNN的方法。
Aug, 2017
我们提出了Power Slow Feature Analysis,它是基于梯度的方法,从高维输入流中提取出时间上缓慢变化的特征,是Slow Feature Analysis的变种,允许任意可微分的体系结构的端到端培训,从而显着扩展了可以有效用于缓慢特征提取的模型类。我们提供实验证据,表明PowerSFA能够在合成低维数据、自我视觉数据以及可以定义点之间对称非时态相似性的一般数据集的情况下提取有意义的、信息丰富的低维特征。
Aug, 2018
通过引入可解释的时空注意力机制来提高视频动作识别的准确性和模型解释性,并使用一组正则化器对其进行约束。利用弱监督的方式仅使用分类标签,模型不仅提高了准确性,还能时空自动定位区分性区域。
Oct, 2018
该研究提出了一种同时提取时域和频域信息中详细和语义信息的方法,包括残差频率注意(rFA)块和同步本地和非本地(SLnL)块,以及软边缘焦点损失(SMFL)来优化学习过程,并在几个大规模数据集上明显优于其他现有方法。
Nov, 2018
介绍了SlowFast网络用于视频识别,它包括Slow路径和Fast路径,其中Slow路径能捕捉空间语义,Fast路径能捕捉精细时间分辨率的动态信息,并能在减小通道容量的前提下实现高精度的视频识别。
Dec, 2018
本论文提出了一种基于选择性特征压缩的动作识别推理策略,通过在时空维度上压缩特征流来显著提高推理效率,从而减少内存使用并略微提高Top1精度,实验表明该方法可以代替常用的30次裁剪密集采样过程。
Apr, 2021
该论文提出了一种基于动态时空特化的模块,通过特定神经元的专业化设计实现 fine-grained 行为识别,并使用特化优化算法进一步优化架构,以适应视频中广泛的时空变化,取得了最先进的性能表现。
Sep, 2022