本文提出了一种简单而高效的双流框架方法,使用全局图像到局部区域的方法识别多类别目标,并提出了多类关注区域模块(MCAR)来解决关注区域数量过多,生成复杂问题,这种方法仅使用图像语义就可以创建新的最佳结果,并在不同因素下进行了广泛的展示。
Jul, 2020
本文提出了一种利用深度学习技术中的循环记忆 - 关注模块来实现图像多标签分类识别的新方法。通过不使用候选区域提取方法,从卷积特征图中定位注意区域,并使用 LSTM 子网络对这些区域进行语义标记和全局依赖性的序列预测。试验表明该方法在识别准确率和效率上均优于现有技术。
Nov, 2017
本研究提出了一种循环注意强化学习框架,通过迭代地发现一系列关注和信息区域,以及进一步预测这些区域中的标签得分,从而实现多标签图像识别。
Dec, 2017
通过引入注意力机制,在端到端的训练过程中将其与最先进的前馈网络结构相结合,我们提出了一种卷积神经网络模型 “Residual Attention Network”,并在 CIFAR-10、CIFAR-100 和 ImageNet 三个基准数据集上实现了最佳的物体识别表现。
Apr, 2017
本文提出利用注意力机制在卷积特征激活层面上进行细粒度图像识别,相对于传统方法,在不需要部分标注的情况下使用低层次特征进行输出概率分配,并在 CIFAR-10、Adience gender recognition task、Stanford Dogs 和 UEC-Food100 等数据集上取得了最先进的分类精度。
Jul, 2019
本文提出了一种基于注意力机制的卷积神经网络方法,使用一握多激励模块学习每个输入图像的多个注意区域特征,并在度量学习框架中应用多注意力多类约束,通过推拉相同 / 不同注意力类别的特征以实现多个目标区域的协调,并引入 Dogs-in-the-Wild 数据集以促进细粒度图像识别研究。
Jun, 2018
提出使用基于注意力模型的深度循环神经网络,加上强化学习训练,以识别并定位输入图像中的多个目标。通过在谷歌街景图像中转录房屋编号序列的挑战性任务上的测试,表明该模型精度高于现有最先进的卷积神经网络,且使用的参数和计算量较少。
Dec, 2014
该论文提出了一种新的方法,利用多源数据分析和注意力机制使得深度网络可以在小目标类别和数据不足的情况下,在街树分类问题中取得了较大的进展。
Jan, 2019
本文介绍了一种使用低分辨率自注意力机制的视觉 Transformer 模型,以较低的计算成本捕捉全局上下文,并在 ADE20K、COCO-Stuff 和 Cityscapes 数据集上表现出优于现有模型的性能。
Oct, 2023
本文提出了一种名为卷积空间注意力(CSA)模型的新方法,可以更好地处理机器阅读理解(MRC)与多项选择问题。该模型可以充分提取文章、问题和候选项之间的相互信息,形成丰富的表示,实验结果表明,该模型在 RACE 和 SemEval-2018 Task11 数据集上可以显著提高各种最先进系统的性能。
Nov, 2018