本研究旨在通过多任务学习方式训练一个网络实现视觉注意力,使用半监督学习方式生成前 / 背景分割标签,进而训练目标检测模型,利用分割地图实现自我注意机制,获得在交通监控领域两个数据集上显著的 mAP 改进,UA-DETRAC 和 UAVDT 数据集上均实现了最先进的结果。
Feb, 2020
本文提出了一种名为 AttentionNet 的基于深度卷积神经网络的新型检测方法,将目标检测问题视为迭代分类问题,通过提供定量化的目标物体弱方向并融合来自 AttentionNet 的迭代预测结果,从而实现更精确的物体边界检测。AttentionNet 是一种统一的目标检测网络,从物体提议到后续的 bounding-box 回归均可进行检测,并在人类检测任务中取得了 65%(AP)的最先进效果,仅采用 8 层结构。
Jun, 2015
通过深度学习网络结构,我们的视觉注意力网络从全局到本地不同范围内的多尺度特征中提取等级显著信息以预测人眼的视觉注视点,并在各种基准数据集上实现了最先进的性能表现。
May, 2017
提出使用基于注意力模型的深度循环神经网络,加上强化学习训练,以识别并定位输入图像中的多个目标。通过在谷歌街景图像中转录房屋编号序列的挑战性任务上的测试,表明该模型精度高于现有最先进的卷积神经网络,且使用的参数和计算量较少。
Dec, 2014
该研究提出了一种新的注意力模型,可以通过多层卷积神经网络的渐进式注意力过程精确地关注各种规模和形状的图像目标。实验证明,与传统的注意力方法相比,在视觉属性预测任务中,所提出的注意力网络效果更好。
Jun, 2016
研究了利用仿生学注意机制的物体识别方法,通过采用集成注意力、分类和定位的双重任务模型,利用人类注意力系统分辨图像中的感兴趣区域。
Apr, 2023
该论文提出了一种基于卷积神经网络的方法,通过提取多尺度的高级视觉特征和上下文信息,结合全局场景信息,用于准确预测视觉显著性,可以适用于资源受限的应用,如(虚拟)机器人系统,从而在多个基准测试数据集上取得了有竞争力和一致的结果。
Feb, 2019
使用人类注意力地图强化深度卷积神经网络的监控信号,并将其应用于目标识别,大幅提高了准确性并生成更接近人类观察者的可解释性更强的视觉特征。
May, 2018
本文提出了一种多样化的视觉注意力网络(DVAN),该网络可以在细粒度分类任务中学习从粗到细的对象特征,通过显式关注多样性,以及使用多个引导注意力应对强监督信息受限的问题,有效提升细粒度分类的表现。
利用弱监督学习和注意力图,我们提出了一种新的建模方法,使得注意力图成为端到端训练的自然组成部分,并通过直接从网络本身探索监督来直接在这些图上提供自我指导,从而成功地解决了以前方法中的缺点,并在语义分割任务上优于现有技术。
Feb, 2018