基于全卷积递归网络的视频分割

Jun, 2016

Recurrent Fully Convolutional Networks for Video Segmentation

Sepehr Valipour, Mennatullah Siam, Martin Jagersand, Nilanjan Ray

TL;DR本文提出了基于卷积门控循环单元网络的在线视频分割方法，利用滑动窗口对时间数据进行处理，并在变化检测数据集上进行实验，相比于常规的全卷积神经网络有 5.5% 的性能提升。

Abstract

image segmentation is an important step in most visual tasks. While convolutional neural networks have shown to perform well on single image segmentation, to our knowledge, no study has been been done on leveragi

image segmentation convolutional neural networks recurrent gated architectures video segmentation temporal data

发现论文，激发创造

卷积门循环神经网络用于视频分割

本文提出了一种基于全卷积神经网络和门控循环体系结构的循环全卷积网络，利用视频中的时间信息进行在线语义分割，大幅提高了分割的准确性，可以在二进制和语义视频分割任务中应用。

Nov, 2016

超越短片段：用于视频分类的深度网络

本论文提出和评估了几个深度神经网络架构，用于对比以往更长时间段内视频图像信息的组合。通过一些新的方法，包括卷积时间特征池化和循环神经网络结构，该论文指出最佳神经网络在 Sports 1 million 数据集（73.1％对 60.9％）和 UCF-101 数据集中（88.6％对 88.0％）及无附加光流信息（82.6％对 72.8％）上明显性能提高。

Mar, 2015

变量计算预算的循环分割

本文提出了一种递归神经网络用于语义图像分割，该网络可在各种计算预算的范围内部署，并可用于有效地分割静态图像和视频。该方法通过利用先前帧的分割来进行视频分割，在降低计算成本的同时保持了分割质量。

Nov, 2017

通过门控循环流传播进行语义视频分割

本文提出了一种利用未标记数据改进的视频语义分割训练模型，该模型结合了卷积架构和时空转换器循环层，并能够通过光流适应性地门控使时间上的标记信息传递，模型通过未标记帧来改善视频分割准确性，并在基于多个深度架构中进行了广泛实验。

Dec, 2016

STFCN：用于语义视频分割的时空 FCN

本文提出了一种包括时空特征的方法来解决语义视频分割问题，使用卷积神经网络和长短时记忆结构相结合的深度学习模型取得了 Camvid 和 NYUDv2 数据集的最先进语义分割性能。

Aug, 2016

ReConvNet: 带有时空特征调制的视频对象分割

ReConvNet 是一种循环卷积架构，用于半监督视频对象分割，能够快速适应其特征以聚焦于感兴趣的任何特定对象。通过条件仿射变换学习自适应于感兴趣的对象的时空特征的方法，不需要额外的推断时间内的训练步骤，且在 DAVIS2016 上表现出有竞争力的结果。

Jun, 2018

长期循环卷积网络用于视觉识别和描述

研究比较深度卷积网络和带有循环结构的深度卷积神经网络的效果，针对视频识别、图像描述、检索以及视频叙事方面的问题，开发出一种新颖的循环卷积架构，该架构可以训练端到端，可以同时学习时间动态和卷积感知表示，并具有学习长期依赖性的能力。实验结果证明，循环卷积模型在识别或生成方面与现有的模型相比具有明显的优势。

Nov, 2014

视觉跟踪的循环滤波学习

本研究提出了一种递归滤波器生成方法来进行视觉跟踪，直接将目标的图像块作为输入，使用递归神经网络来生成一个特定于目标的滤波器，通过将 RNN 中的全连接层的矩阵乘法扩展到特征图上的卷积运算，对目标的空间结构进行保留和内存优化。

Aug, 2017

超越时序池化：基于循环和时态卷积的视频手势识别

我们探索用于视频手势识别的深度架构，其中包括时间卷积和双向递归，并展示循环在任务中的重要性，进而证明添加时间卷积会带来显著提高。我们在 Montalbano 手势识别数据集上评估了这些不同方法，并实现了最新的结果。

Jun, 2015

视觉注意力的循环模型

通过引入一种新的循环神经网络模型，允许自适应选择一系列区域或位置并仅处理所选区域。该模型可通过强化学习方法训练，提高图像分类性能，并能够跟踪简单对象。

Jun, 2014