研究比较深度卷积网络和带有循环结构的深度卷积神经网络的效果,针对视频识别、图像描述、检索以及视频叙事方面的问题,开发出一种新颖的循环卷积架构,该架构可以训练端到端,可以同时学习时间动态和卷积感知表示,并具有学习长期依赖性的能力。实验结果证明,循环卷积模型在识别或生成方面与现有的模型相比具有明显的优势。
Nov, 2014
通过引入前馈卷积神经网络与反馈式局部循环连接设计,提高图像识别准确性,更加贴近灵长类动物视觉系统的神经活动,为当代物体识别任务的研究提供了新的思路。
Jun, 2018
本文提出了一种利用深度学习技术中的循环记忆 - 关注模块来实现图像多标签分类识别的新方法。通过不使用候选区域提取方法,从卷积特征图中定位注意区域,并使用 LSTM 子网络对这些区域进行语义标记和全局依赖性的序列预测。试验表明该方法在识别准确率和效率上均优于现有技术。
Nov, 2017
提出使用基于注意力模型的深度循环神经网络,加上强化学习训练,以识别并定位输入图像中的多个目标。通过在谷歌街景图像中转录房屋编号序列的挑战性任务上的测试,表明该模型精度高于现有最先进的卷积神经网络,且使用的参数和计算量较少。
Dec, 2014
本文提出了一种新的空间监督递归卷积神经网络,用于视觉对象跟踪,通过研究长短期记忆和区域信息的回归能力,结合卷积网络产生的高层视觉特征直接预测跟踪位置,相较于现有的深度学习跟踪器,我们的跟踪器在保持低计算成本的同时更加准确和鲁棒,实验结果表明在多个数据集上均表现优异,常常优于排名第二的跟踪器。
Jul, 2016
本研究提出了一种循环注意强化学习框架,通过迭代地发现一系列关注和信息区域,以及进一步预测这些区域中的标签得分,从而实现多标签图像识别。
Dec, 2017
本研究提出了一种递归滤波器生成方法来进行视觉跟踪,直接将目标的图像块作为输入,使用递归神经网络来生成一个特定于目标的滤波器,通过将 RNN 中的全连接层的矩阵乘法扩展到特征图上的卷积运算,对目标的空间结构进行保留和内存优化。
Aug, 2017
本文提出利用注意力机制在卷积特征激活层面上进行细粒度图像识别,相对于传统方法,在不需要部分标注的情况下使用低层次特征进行输出概率分配,并在 CIFAR-10、Adience gender recognition task、Stanford Dogs 和 UEC-Food100 等数据集上取得了最先进的分类精度。
Jul, 2019
本文探讨了视频识别中的空间冗余问题,提出了一种基于强化学习的自适应空间视频识别方法(AdaFocus),通过在一个小图像块的空间序列上采用高效的卷积神经网络和循环决策网络来定位和选择最相关的区域,以提高计算效率和精度。
May, 2021
本文提出了基于卷积门控循环单元网络的在线视频分割方法,利用滑动窗口对时间数据进行处理,并在变化检测数据集上进行实验,相比于常规的全卷积神经网络有 5.5% 的性能提升。
Jun, 2016