深度时间线性编码网络

Nov, 2016

Deep Temporal Linear Encoding Networks

Ali Diba, Vivek Sharma, Luc Van Gool

TL;DR该研究介绍了一种新的视频表示方法 —— 时间线性编码 (TLE)，通过端到端学习的方式，将视频中的外观和动作全局编码到一种紧凑的特征表示中，可以应用于 2D 和 3D CNNs，并且在人类动作识别任务上表现更好。

Abstract

The CNN-encoding of features from entire videos for the representation of human actions has rarely been addressed. Instead, CNN work has focused on approaches to fuse spatial and temporal networks, but these were typically limited to processing shorter sequences. We present a new video representation, called →

cnn encoding temporal linear encoding video feature representation end-to-end learning human action recognition

发现论文，激发创造

动作识别的时间分离表征学习

本研究通过设计渐进式增强模块（PEM）和创建时间多样性损失（TD Loss）两种方法，以解决将 2D CNN 应用于视频分析中出现的重复和冗余信息利用问题，并在 Something-Something V1 和 V2 等基准时间推理数据集上取得 2.4％和 1.3％的性能改进，同时在大规模数据集 Kinetics 上也 witness 了超过基于 2D-CNN 的现有技术的性能提升。

Jul, 2020

用于动作分割和检测的时序卷积网络

介绍了一种新的 Temporal Convolutional Networks 模型，可用于对视频中动作的细粒度分割和检测，具有高效性和良好的表现。

Nov, 2016

时序卷积网络：行动分割的统一方法

提出了一种统一的时间卷积网络方法，可以逐层捕捉低、中、高层次时间尺度上的关系，在三个公共操作分割数据集上以视频或传感器数据实现了优越或竞争性能，并且可以在较短时间内训练完成。

Aug, 2016

TEINet: 面向视频识别的高效架构

提出了一种称为 TEI 模块的有效的时序模块，它可插入现有的 2D CNN 中。与三维卷积相比，该方法学习时序特征的的范例不仅能够灵活有效地捕捉到时序结构，还具有高效性。

Nov, 2019

基于时间金字塔池化的卷积神经网络用于动作识别

该论文提出了一种新的网络结构，可以允许任意数量的帧作为网络输入，并采用编码层、时空金字塔池化层和特征拼接层解决了 CNN 在视频分类中帧数不定的问题，实验结果表明该方法在使用更少的训练数据时能超越同类方法。

Mar, 2015

行动识别的长期时间卷积

通过使用长时序卷积神经网络和高质量的光流估计，该研究获得了 UCF101 和 HMDB51 数据集上最先进的人类动作识别结果，具备良好的行为表示和准确性。

Apr, 2016

利用时间结构描述视频

这篇论文提出了一种基于循环神经网络和 3-D 卷积神经网络以及时间注意力机制的视频自动描述方法，并在 Youtube2Text 数据集上的 BLEU 和 METEOR 度量标准上超过了当前最先进的结果，并在更大更具挑战性的配对视频和自然语言描述数据集上进行了测试。

Feb, 2015

面向时间序列的通用神经网络编码器

该研究探讨了使用时间序列编码器学习适用于其未经训练的数据集类型的表示，性能优越，适应性强，可用于处理标记稀疏或未标记的时间序列数据，并通过卷积神经网络和注意机制等多种方法使其性能更加优异。

May, 2018

TSP: 为定位任务进行的视频编码器时间敏感预训练

该研究提出了一种新的监督预训练范例，通过考虑背景剪辑和全局视频信息，不仅需要训练活动分类，而且还需要训练时序灵敏度，从而显着提高了最近最先进的方法在三个任务中的性能：时间动作本地化，行动建议生成和密集视频字幕。

Nov, 2020

超越短片段：用于视频分类的深度网络

本论文提出和评估了几个深度神经网络架构，用于对比以往更长时间段内视频图像信息的组合。通过一些新的方法，包括卷积时间特征池化和循环神经网络结构，该论文指出最佳神经网络在 Sports 1 million 数据集（73.1％对 60.9％）和 UCF-101 数据集中（88.6％对 88.0％）及无附加光流信息（82.6％对 72.8％）上明显性能提高。

Mar, 2015