用于动作分割和检测的时序卷积网络
该论文提出了一种新的网络结构,可以允许任意数量的帧作为网络输入,并采用编码层、时空金字塔池化层和特征拼接层解决了CNN在视频分类中帧数不定的问题,实验结果表明该方法在使用更少的训练数据时能超越同类方法。
Mar, 2015
本文提出了一种新的视频动作识别框架-TSN,并探究了在时间段网络的帮助下学习ConvNet模型的一系列良好实践策略。实验结果表明,本方法在HMDB51(69.4%)和UCF101(94.2%)数据集上取得了最先进的性能。我们还可视化了学习到的ConvNet模型,定性展示了时间段网络和所提出良好实践的有效性。
Aug, 2016
提出了一种统一的时间卷积网络方法,可以逐层捕捉低、中、高层次时间尺度上的关系,在三个公共操作分割数据集上以视频或传感器数据实现了优越或竞争性能,并且可以在较短时间内训练完成。
Aug, 2016
本文提出了一种新的混合时态卷积和循环神经网络 (TricorNet) 模型,其具有编码器-解码器结构,通过编码器捕捉不同动作的局部运动变化,解码器能够学习和记忆长期的动作依赖性,该模型在三个行动分割数据集上的实验结果表明,在视频序列标注方面,所提出的模型优于现有技术水平。
May, 2017
该研究论文提出了一种基于3D CNN和新颖的神经网络结构,可以使视频分类和人类行为识别的准确性优于现有技术,并通过迁移学习的技巧从二维卷积神经网络中转移知识来改善三维卷积神经网络的训练效果。
Nov, 2017
本研究提出了一种多阶段架构方法来解决视频动作分段问题,使用扩张卷积神经网络来生成初始预测并利用平滑损失进行训练,模型在多个数据集上实现了最新的研究成果。
Mar, 2019
本文提出了一种多阶段架构的深度学习模型,通过利用扩张时间卷积和双重扩张时间卷积层,实现了在长时间的未修剪视频中对动作进行准确的时序分割,并在三个数据集上取得了最先进的结果。
Jun, 2020
本文提出了一种新的带有多分辨率的粗到细结构解码器来处理序列断裂问题,使用多分辨率特征增强策略增强训练来提高对于不同时间分辨率的鲁棒性,同时提出了一个视频级别的行为损失来支持架构和鼓励序列的连贯性,在三个时间视频分割基准测试中打破了现有技术的记录。
May, 2021