用于动作分割和检测的时序卷积网络

Nov, 2016

用于动作分割和检测的时序卷积网络

Temporal Convolutional Networks for Action Segmentation and Detection

Colin Lea, Michael D. Flynn, Rene Vidal, Austin Reiter, Gregory D. Hager

TL;DR介绍了一种新的 Temporal Convolutional Networks模型，可用于对视频中动作的细粒度分割和检测，具有高效性和良好的表现。

Abstract

The ability to identify and temporally segment fine-grained human actions throughout a video is crucial for robotics, surveillance, education, and beyond. Typical approaches decouple this problem by first extracting local spatiotemporal features from video frames and then feeding them

发现论文，激发创造

基于时间金字塔池化的卷积神经网络用于动作识别

该论文提出了一种新的网络结构，可以允许任意数量的帧作为网络输入，并采用编码层、时空金字塔池化层和特征拼接层解决了CNN在视频分类中帧数不定的问题，实验结果表明该方法在使用更少的训练数据时能超越同类方法。

Mar, 2015

时序段网络：深度动作识别的良好实践

本文提出了一种新的视频动作识别框架-TSN，并探究了在时间段网络的帮助下学习ConvNet模型的一系列良好实践策略。实验结果表明，本方法在HMDB51（69.4%）和UCF101（94.2%）数据集上取得了最先进的性能。我们还可视化了学习到的ConvNet模型，定性展示了时间段网络和所提出良好实践的有效性。

Aug, 2016

时序卷积网络：行动分割的统一方法

提出了一种统一的时间卷积网络方法，可以逐层捕捉低、中、高层次时间尺度上的关系，在三个公共操作分割数据集上以视频或传感器数据实现了优越或竞争性能，并且可以在较短时间内训练完成。

Aug, 2016

CDC:卷积-反卷积网络在未剪辑视频中实现精确的时间动作定位

提出了一种使用CDC网络和3D ConvNets实现时间上精细边界检测的方法，并达到了非常高的效率和性能。

Mar, 2017

视频中的动作识别时间分段网络

该论文提出了一种称之为“时间段网络”的视频级框架，可以学习视频中的动作模型，并在四个具有挑战性的动作识别基准测试中实现了最新的性能。

May, 2017

TricorNet：用于视频动作分割的混合时态卷积和循环网络

本文提出了一种新的混合时态卷积和循环神经网络 (TricorNet) 模型，其具有编码器-解码器结构，通过编码器捕捉不同动作的局部运动变化，解码器能够学习和记忆长期的动作依赖性，该模型在三个行动分割数据集上的实验结果表明，在视频序列标注方面，所提出的模型优于现有技术水平。

May, 2017

时域三维卷积神经网络：视频分类的新架构和迁移学习

该研究论文提出了一种基于3D CNN和新颖的神经网络结构，可以使视频分类和人类行为识别的准确性优于现有技术，并通过迁移学习的技巧从二维卷积神经网络中转移知识来改善三维卷积神经网络的训练效果。

Nov, 2017

MS-TCN：多阶段时间卷积网络用于动作分割

本研究提出了一种多阶段架构方法来解决视频动作分段问题，使用扩张卷积神经网络来生成初始预测并利用平滑损失进行训练，模型在多个数据集上实现了最新的研究成果。

Mar, 2019

MS-TCN++：基于多阶段时间卷积网络的动作分割

本文提出了一种多阶段架构的深度学习模型，通过利用扩张时间卷积和双重扩张时间卷积层，实现了在长时间的未修剪视频中对动作进行准确的时序分割，并在三个数据集上取得了最先进的结果。

Jun, 2020

粗到细的多分辨率时间卷积网络

本文提出了一种新的带有多分辨率的粗到细结构解码器来处理序列断裂问题，使用多分辨率特征增强策略增强训练来提高对于不同时间分辨率的鲁棒性，同时提出了一个视频级别的行为损失来支持架构和鼓励序列的连贯性，在三个时间视频分割基准测试中打破了现有技术的记录。

May, 2021