本文提出了基于卷积门控循环单元网络的在线视频分割方法,利用滑动窗口对时间数据进行处理,并在变化检测数据集上进行实验,相比于常规的全卷积神经网络有 5.5% 的性能提升。
Jun, 2016
本文提出了一种利用未标记数据改进的视频语义分割训练模型,该模型结合了卷积架构和时空转换器循环层,并能够通过光流适应性地门控使时间上的标记信息传递,模型通过未标记帧来改善视频分割准确性,并在基于多个深度架构中进行了广泛实验。
Dec, 2016
本文提出了一种包括时空特征的方法来解决语义视频分割问题,使用卷积神经网络和长短时记忆结构相结合的深度学习模型取得了 Camvid 和 NYUDv2 数据集的最先进语义分割性能。
Aug, 2016
本文提出了一种递归神经网络用于语义图像分割,该网络可在各种计算预算的范围内部署,并可用于有效地分割静态图像和视频。该方法通过利用先前帧的分割来进行视频分割,在降低计算成本的同时保持了分割质量。
Nov, 2017
本篇文章提出了一种视觉特征编码技术,使用门控循环单元(GRUs)生成语义丰富的视频字幕,并在 MSVD 和 MSR-VTT 数据集上创造了新的 METEOR 和 ROUGE_L 度量标准的最新技术水平。
Feb, 2019
本文提出了一种端到端可训练的深度学习模型,利用时间信息来利用易于获取的未标记数据,从而解决了视频分割中标签稀缺的问题。实验结果表明,该模型能够显著优于基线方法和逐帧图像分割。
Aug, 2019
探讨了如何在图像识别的语义分割领域中,采用 ReNet 层代替全卷积神经网络中的级联卷积和池化层来使局部感受野具有全局信息,并开发了一种新的混合深层 ReNet(H-ReNet)模型,经实验证明其在 PASCAL VOC 2012 基准测试中的识别准确度比 Piecewise、CRFasRNN 和 DeepParsing 高 3.6%、2.3% 和 0.2%。
Mar, 2016
ReConvNet 是一种循环卷积架构,用于半监督视频对象分割,能够快速适应其特征以聚焦于感兴趣的任何特定对象。通过条件仿射变换学习自适应于感兴趣的对象的时空特征的方法,不需要额外的推断时间内的训练步骤,且在 DAVIS2016 上表现出有竞争力的结果。
Jun, 2018
本研究介绍了双射门控循环单元,为计算机视觉中未来视频预测问题提供了一种有效的方法,能够使编码 / 解码器之间的状态共享并减少计算成本,达到了与最优方法相当的性能。
Dec, 2017
研究比较深度卷积网络和带有循环结构的深度卷积神经网络的效果,针对视频识别、图像描述、检索以及视频叙事方面的问题,开发出一种新颖的循环卷积架构,该架构可以训练端到端,可以同时学习时间动态和卷积感知表示,并具有学习长期依赖性的能力。实验结果证明,循环卷积模型在识别或生成方面与现有的模型相比具有明显的优势。
Nov, 2014