卷积分层递归神经网络学习上下文依赖关系

Sep, 2015

卷积分层递归神经网络学习上下文依赖关系

Learning Contextual Dependencies with Convolutional Hierarchical Recurrent Neural Networks

Zhen Zuo, Bing Shuai, Gang Wang, Xiao Liu, Xingxing Wang...

TL;DR该研究提出了一种基于深度卷积神经网络和分层递归神经网络的图像分类模型，以更好地编码图像区域之间的空间和比例依赖关系，从而取得了在四个具有挑战性的目标/场景图像分类基准测试中最先进的结果。

Abstract

Existing deep convolutional neural networks (CNNs) have shown their great success on image classification. CNNs mainly consist of convolutional and pooling layers, both of which are performed on local image areas

发现论文，激发创造

场景解析的循环卷积神经网络

通过循环卷积神经网络的方法，可在不依赖于分割方法和任务特定特征的情况下，对图像里的所有像素赋予分类标签，并且无需在测试时像其他方法那样昂贵，因此可在 Stanford Background 数据集和 SIFT Flow 数据集上获得最先进的性能。

Jun, 2013

长期循环卷积网络用于视觉识别和描述

研究比较深度卷积网络和带有循环结构的深度卷积神经网络的效果，针对视频识别、图像描述、检索以及视频叙事方面的问题，开发出一种新颖的循环卷积架构，该架构可以训练端到端，可以同时学习时间动态和卷积感知表示，并具有学习长期依赖性的能力。实验结果证明，循环卷积模型在识别或生成方面与现有的模型相比具有明显的优势。

Nov, 2014

应用于字幕生成的分层循环神经网络视频编码器

本文提出了一种新的层次循环神经编码器（HRNE）方法来利用视频的时间信息，该方法能够有效地减少输入信息流的长度，合成多个连续输入，并降低计算操作，且能够探测不同粒度的帧块之间的时间过渡，应用于视频字幕生成中实验表明其优于现有的视频字幕系统。

Nov, 2015

CNN-RNN：一种多标签图像分类的统一框架

本文提出了一种基于卷积神经网络和循环神经网络的框架，用于多标签图像分类，通过学习图像标签嵌入特征，显式地利用了图像标签之间的关联性，拥有较好的分类性能。

Apr, 2016

具多层上下文的带注意力机制的RNN用于场景标注

探索多级上下文循环神经网络的多种上下文提示，将其结合到分级卷积神经网络中，提供丰富的空间和语义信息，并使用注意力模型来有效地合并多个级别，以实现在图像标签方面的最新结果。

Jul, 2016

多路径反馈循环神经网络用于场景解析

本研究提出一种新的MPF-RNN模型，通过多层反馈和多重加权循环结构，增强RNN建模长范围的上下文信息和识别易混淆像素的能力，此外还提出了考虑多次反馈的损失累积策略，从而在场景分割方面实现了比传统模型更优秀的性能表现。

Aug, 2016

基于区域潜在语义相关性的多标签图像分类

本论文提出了一种区域潜在语义依赖模型，该模型使用卷积神经网络和递归神经网络相结合，能够有效预测多标签图像分类中小物体和视觉概念，同时不需要使用边框注释实现最佳性能。

Dec, 2016

使用辅助损失学习 RNN 中的长期依赖关系

通过增加自监督辅助损失，提高循环神经网络对长期依赖关系的识别能力，可应用于序列长度达16,000的图像分类和实际文档分类任务中，具有竞争基线模型无法比拟的良好性能和资源效率。

Mar, 2018

通过建模上下文依赖性实现精确的二进制神经网络

本文中，我们提出了可用于学习视觉模型的有效二进制神经模块。我们将二进制多层感知器（MLP）块作为二进制卷积块的替代方案，通过模型化短程和长程特征依赖关系来解决二进制模型上下文依赖关系的问题。我们构建了显式上下文依赖建模的BNNs，称为BCDNet，在标准的ImageNet分类基准测试中，BCDNet实现了72.3％的Top-1准确率，并以类似的操作超越了领先的二进制方法。

Sep, 2022

针对静态图像的递归神经网络

本研究解决了递归神经网络（RNN）在处理静态图像时的不典型应用，通常该任务由卷积神经网络（CNN）主导。论文提出将像素视为序列来处理图像，并设计了一种新的二维输入RNN结构，尤其适合嵌入式系统。实验结果表明，在COCO和CIFAR100数据集上，这一方法在小型网络中具有更好的性能。

Sep, 2024