本文提出了一种基于全卷积神经网络和门控循环体系结构的循环全卷积网络,利用视频中的时间信息进行在线语义分割, 大幅提高了分割的准确性,可以在二进制和语义视频分割任务中应用。
Nov, 2016
本论文提出和评估了几个深度神经网络架构,用于对比以往更长时间段内视频图像信息的组合。通过一些新的方法,包括卷积时间特征池化和循环神经网络结构,该论文指出最佳神经网络在 Sports 1 million 数据集(73.1%对 60.9%)和 UCF-101 数据集中(88.6%对 88.0%)及无附加光流信息(82.6%对 72.8%)上明显性能提高。
Mar, 2015
本文提出了一种递归神经网络用于语义图像分割,该网络可在各种计算预算的范围内部署,并可用于有效地分割静态图像和视频。该方法通过利用先前帧的分割来进行视频分割,在降低计算成本的同时保持了分割质量。
Nov, 2017
本文提出了一种利用未标记数据改进的视频语义分割训练模型,该模型结合了卷积架构和时空转换器循环层,并能够通过光流适应性地门控使时间上的标记信息传递,模型通过未标记帧来改善视频分割准确性,并在基于多个深度架构中进行了广泛实验。
Dec, 2016
本文提出了一种包括时空特征的方法来解决语义视频分割问题,使用卷积神经网络和长短时记忆结构相结合的深度学习模型取得了 Camvid 和 NYUDv2 数据集的最先进语义分割性能。
Aug, 2016
ReConvNet 是一种循环卷积架构,用于半监督视频对象分割,能够快速适应其特征以聚焦于感兴趣的任何特定对象。通过条件仿射变换学习自适应于感兴趣的对象的时空特征的方法,不需要额外的推断时间内的训练步骤,且在 DAVIS2016 上表现出有竞争力的结果。
Jun, 2018
研究比较深度卷积网络和带有循环结构的深度卷积神经网络的效果,针对视频识别、图像描述、检索以及视频叙事方面的问题,开发出一种新颖的循环卷积架构,该架构可以训练端到端,可以同时学习时间动态和卷积感知表示,并具有学习长期依赖性的能力。实验结果证明,循环卷积模型在识别或生成方面与现有的模型相比具有明显的优势。
Nov, 2014
本研究提出了一种递归滤波器生成方法来进行视觉跟踪,直接将目标的图像块作为输入,使用递归神经网络来生成一个特定于目标的滤波器,通过将 RNN 中的全连接层的矩阵乘法扩展到特征图上的卷积运算,对目标的空间结构进行保留和内存优化。
Aug, 2017
我们探索用于视频手势识别的深度架构,其中包括时间卷积和双向递归,并展示循环在任务中的重要性,进而证明添加时间卷积会带来显著提高。我们在 Montalbano 手势识别数据集上评估了这些不同方法,并实现了最新的结果。
Jun, 2015
通过引入一种新的循环神经网络模型,允许自适应选择一系列区域或位置并仅处理所选区域。该模型可通过强化学习方法训练,提高图像分类性能,并能够跟踪简单对象。
Jun, 2014