动作识别的排名汇聚

Dec, 2015

Rank Pooling for Action Recognition

Basura Fernando, Efstratios Gavves, Jose Oramas, Amir Ghodrati, Tinne Tuytelaars

TL;DR提出了一种函数为基础的时间汇集方法，该方法可捕获视频序列数据的潜在结构，并生成一个新的视频表示形式以适用于动作识别问题。结果表明，对于泛化的动作识别问题，精细化的动作识别问题和手势识别问题等，此方法都能够显著提高平均汇集基线的绝对值 7-10。

Abstract

We propose a function-based temporal pooling method that captures the latent structure of the video sequence data - e.g. how frame-level features evolve over time in a video. We show how the parameters of a function that has been fit to the video data can serve as a robust new

function-based temporal pooling latent structure video representation action recognition rank pooling

发现论文，激发创造

通用排名池化用于活动识别

本文提出了一种新的广义秩池化方法，利用深度模型进行行为识别，保留帧之间的时序关系，实现对行为的更好分类识别效果。在基于多个活动识别的数据集上，广义秩池化的模型取得了最先进的识别效果。

Apr, 2017

使用区分性汇聚进行视频表示学习

本文提出一种基于深度学习的视频分类与识别方法，使用判别池化和多实例学习对视频进行分类，取得了在多项基准测试数据集上的最佳表现。

Mar, 2018

基于时间金字塔池化的卷积神经网络用于动作识别

该论文提出了一种新的网络结构，可以允许任意数量的帧作为网络输入，并采用编码层、时空金字塔池化层和特征拼接层解决了 CNN 在视频分类中帧数不定的问题，实验结果表明该方法在使用更少的训练数据时能超越同类方法。

Mar, 2015

结构化关键点池化的基于关键点的统一动作识别框架

本文提出了一种利用点云深度学习范式的方法，并引入了一种名为结构化关键点池化的深度神经网络架构，该方法针对骨架检测和跟踪误差、目标动作的少样性以及针对个人和帧的动作识别提出了统一的解决方案，同时还提出了一种 Pooling-Switching Trick，能够在弱监督下处理不同视频中的多个点云，实现对新数据的有效扩充，相比之前的研究能够更好地进行骨架和时空动作的识别和本地化。

Mar, 2023

动态图像网络在动作识别中的应用

本文介绍了动态图像的概念，它是一种新型的紧凑表示方法，可用于视频分析，特别是与卷积神经网络（CNNs）相结合。它允许将任何视频转换为图片，从而可以立即将现有的针对静态图像分析的 CNN 模型扩展到视频，并在动作识别等标准基准测试中实现了最先进的性能。

Dec, 2016

视频动作识别的分层特征聚合网络

本文提出了一种介于 3D 卷积和 CNN 特征融合之间的方法，使用卷积结构学习适当的模式，同时保留了特征流，并检验了该方法在 TSN、TRN 和 ECO 模型上的效果。

May, 2019

非线性时间子空间表示用于行为识别

利用核化排名池化方法压缩数据序列表示，作为时间序列数据处理的新方法，能够提高计算机视觉，机器学习，人类动作识别等算法的效率和准确性。

Mar, 2018

第一人称视角视频的动作特征汇聚

本文提出了一种基于时间序列池化的特征表示框架，用于抽象活动视频中的短期 / 长期特征描述符的变化，并用于处理第一人称视频活动数据集的动作识别问题，与基于视觉词袋和改进的 Fisher 矢量的特征表示相比能够更好地表征第一人称视频中的动作。

Dec, 2014

超越时序池化：基于循环和时态卷积的视频手势识别

我们探索用于视频手势识别的深度架构，其中包括时间卷积和双向递归，并展示循环在任务中的重要性，进而证明添加时间卷积会带来显著提高。我们在 Montalbano 手势识别数据集上评估了这些不同方法，并实现了最新的结果。

Jun, 2015

移动视频动作识别

本文研究了在移动设备上的视频动作识别任务，提出了一个基于 MobileNetV2 和 Temporal Trilinear Pooling (TTP) 模块的方法，使用多种模态处理压缩视频，并进行了效率测试，结果表明我们的模型在移动设备上可以实现 40FPS 的识别速度，且在模型大小和时间消耗方面表现优异。

Aug, 2019