基于注意力机制的深度神经网络在物体检测任务中的应用
Feb, 2017
通过深度学习网络结构,我们的视觉注意力网络从全局到本地不同范围内的多尺度特征中提取等级显著信息以预测人眼的视觉注视点,并在各种基准数据集上实现了最先进的性能表现。
May, 2017
本文提出利用注意力机制在卷积特征激活层面上进行细粒度图像识别,相对于传统方法,在不需要部分标注的情况下使用低层次特征进行输出概率分配,并在 CIFAR-10、Adience gender recognition task、Stanford Dogs 和 UEC-Food100 等数据集上取得了最先进的分类精度。
Jul, 2019
本篇研究提出一种混合自下而上和自上而下视觉关注机制,能在对象和其他显著图像区域的水平上计算注意力权重,实现更深入图像理解,将其应用于图像字幕生成和视觉问答任务中,取得了优于现有技术的成绩。
Jul, 2017
本文提出了一种使用深度神经网络应用视觉注意力于细粒度分类任务的新管道,通过整合三种类型的注意力,训练领域特定的深度网络,在弱监督约束下避免使用昂贵的注释,并在 ILSVRC2012 数据集和 CUB200_2011 数据集的子集上验证了该方法的有效性,取得了与其他方法相竞争的表现。
Nov, 2014
通过 79 个实验和 7,810 个实验参与者的数据研究,揭示了同人类视觉选择性估计有显著重叠的被动关注技术,指出使用引导反向传播方法探测相对简单的神经网络架构产生的输入可视化是预测共享成分的最佳选择,这些结果帮助我们通过比较不同模型在图像信息选择性方面的相似性和差异性来评估领先的神经网络模型作为人类视觉模型的生物学和心理学的有效性。
Jul, 2021
使用两种类型的注意力机制:从上至下的语言传达信息和自底向上的视觉信号,通过提出 Boosted Attention 模型实现将它们整合在图像字幕生成任务中,从而提高了效果。
Mar, 2019
通过利用关注机制的生成学习框架,可以将图像中感兴趣的区域传递给生成建模的标准表征,并集中精力在感兴趣的对象上,从而建立新面孔的生成模型。
Dec, 2013
本研究旨在通过多任务学习方式训练一个网络实现视觉注意力,使用半监督学习方式生成前 / 背景分割标签,进而训练目标检测模型,利用分割地图实现自我注意机制,获得在交通监控领域两个数据集上显著的 mAP 改进,UA-DETRAC 和 UAVDT 数据集上均实现了最先进的结果。
Feb, 2020
通过加入可训练的注意力模块,使得卷积神经网络在进行图像分类时能够更好地聚焦于感兴趣的区域,进一步提高了模型的稳健性。
Apr, 2018