通过引入一种新的循环神经网络模型,允许自适应选择一系列区域或位置并仅处理所选区域。该模型可通过强化学习方法训练,提高图像分类性能,并能够跟踪简单对象。
Jun, 2014
研究比较深度卷积网络和带有循环结构的深度卷积神经网络的效果,针对视频识别、图像描述、检索以及视频叙事方面的问题,开发出一种新颖的循环卷积架构,该架构可以训练端到端,可以同时学习时间动态和卷积感知表示,并具有学习长期依赖性的能力。实验结果证明,循环卷积模型在识别或生成方面与现有的模型相比具有明显的优势。
Nov, 2014
本文中介绍了一种基于多维 LSTM 的递归图像模型,该模型可以捕获长距离像素之间的统计依赖,适用于纹理合成和补全等多项任务,并在多个图像数据集上的定量比较中表现优异。
Jun, 2015
该研究提出了一种基于深度卷积神经网络和分层递归神经网络的图像分类模型,以更好地编码图像区域之间的空间和比例依赖关系,从而取得了在四个具有挑战性的目标/场景图像分类基准测试中最先进的结果。
Sep, 2015
本文介绍了一种深度神经网络模型,用于在两个空间维度上序列预测图像像素;该模型对图像的离散概率进行建模,并在深层循环网络中使用了快速的二维循环层和残差连接,实现了比以前的最新技术更好的自然图像日志似然度分数。
Jan, 2016
通过引入前馈卷积神经网络与反馈式局部循环连接设计,提高图像识别准确性,更加贴近灵长类动物视觉系统的神经活动,为当代物体识别任务的研究提供了新的思路。
Jun, 2018
本文研究了深度神经网络的层次结构特征,发现递归神经网络与前馈网络在提取特征和处理深层次信息方面表现出类似的表现和性能优越,且递归模型能够模拟前馈模型的行为并使用更少的参数来实现图像分类和迷宫问题的求解。
Feb, 2021
本文提出了一种通过利用视觉数据中的空间稀疏性进行模型加速的新方法,该方法基于所提出的动态令牌稀疏化框架,并通过自适应和不对称计算等方式推广到各种体系结构中,通过对不重要的特征使用轻量级快速路径和对更重要位置使用更具表现力的慢速路径,可以显著减少总体计算量,实验结果表明动态空间稀疏化为模型加速提供了新的更有效的解决方案。
Jul, 2022
通過使用自適應遞歸神經網絡,我們研究了可根據輸入要求動態分配計算資源的遞歸處理,在視覺推理問題中實現了對更困難程度的一般化,而無需訓練。
Nov, 2023
该论文研究了一种高效的基于自回归的视觉模型,通过有限的数据集在测试阶段展示了其在高层次和低层次语义理解等各种视觉任务上的能力,减少了参数占用以及训练数据要求,为通用视觉模型领域的可持续性和可访问性提供了重要进展。
Feb, 2024