深度时间线性编码网络
本研究通过设计渐进式增强模块(PEM)和创建时间多样性损失(TD Loss)两种方法,以解决将 2D CNN 应用于视频分析中出现的重复和冗余信息利用问题,并在 Something-Something V1 和 V2 等基准时间推理数据集上取得 2.4%和 1.3%的性能改进,同时在大规模数据集 Kinetics 上也 witness 了超过基于 2D-CNN 的现有技术的性能提升。
Jul, 2020
提出了一种统一的时间卷积网络方法,可以逐层捕捉低、中、高层次时间尺度上的关系,在三个公共操作分割数据集上以视频或传感器数据实现了优越或竞争性能,并且可以在较短时间内训练完成。
Aug, 2016
提出了一种称为 TEI 模块的有效的时序模块,它可插入现有的 2D CNN 中。与三维卷积相比,该方法学习时序特征的的范例不仅能够灵活有效地捕捉到时序结构,还具有高效性。
Nov, 2019
该论文提出了一种新的网络结构,可以允许任意数量的帧作为网络输入,并采用编码层、时空金字塔池化层和特征拼接层解决了 CNN 在视频分类中帧数不定的问题,实验结果表明该方法在使用更少的训练数据时能超越同类方法。
Mar, 2015
这篇论文提出了一种基于循环神经网络和 3-D 卷积神经网络以及时间注意力机制的视频自动描述方法,并在 Youtube2Text 数据集上的 BLEU 和 METEOR 度量标准上超过了当前最先进的结果,并在更大更具挑战性的配对视频和自然语言描述数据集上进行了测试。
Feb, 2015
该研究探讨了使用时间序列编码器学习适用于其未经训练的数据集类型的表示,性能优越,适应性强,可用于处理标记稀疏或未标记的时间序列数据,并通过卷积神经网络和注意机制等多种方法使其性能更加优异。
May, 2018
该研究提出了一种新的监督预训练范例,通过考虑背景剪辑和全局视频信息,不仅需要训练活动分类,而且还需要训练时序灵敏度,从而显着提高了最近最先进的方法在三个任务中的性能:时间动作本地化,行动建议生成和密集视频字幕。
Nov, 2020
本论文提出和评估了几个深度神经网络架构,用于对比以往更长时间段内视频图像信息的组合。通过一些新的方法,包括卷积时间特征池化和循环神经网络结构,该论文指出最佳神经网络在 Sports 1 million 数据集(73.1%对 60.9%)和 UCF-101 数据集中(88.6%对 88.0%)及无附加光流信息(82.6%对 72.8%)上明显性能提高。
Mar, 2015