ECCVAug, 2018
通过引导式硬关注训练视觉问答模型
Learning Visual Question Answering by Bootstrapping Hard Attention
Mateusz Malinowski, Carl Doersch, Adam Santoro, Peter Battaglia
TL;DR本文介绍了一种新型的硬注意力机制,该机制忽略了某些特征但仍能达到与软注意力相同或更好的性能,而且因为其选择了输入信息的重要特征,因此比类似的软注意力机制更加高效。
Abstract
attention mechanisms in biological perception are thought to select subsets
of perceptual information for more sophisticated processing which would be
prohibitive to perform on all sensory inputs. In computer vision, however,
there has been relatively little exploration of
发现论文,激发创造
用于视觉问答的高阶注意力模型
本文提出了一种新颖且通用的注意力机制,可以学习不同数据模态之间的高阶相关性。 作者实验证明高阶相关性可以将适当的关注点引导到不同数据模态中的相关元素,来更好地解决联合任务,如视觉问答(VQA),在 VQA 标准数据集上实现了最先进的性能。
Nov, 2017
深度神经网络中人和机器关注的更多理解
通过对机器注意力机制和人类视觉注意力关系的系统研究,本文发现人类关注可以作为注意驱动任务有意义的基准,并证明更接近人工注意力机制的性能更好,同时更好的注意力对于更高级别的计算机视觉任务的可解释性也有显著提升。
Jun, 2019
深度学习中的视觉注意方法:深入调查
本文阐述了注意力机制在深度学习的应用,提出缺乏对于注意力技术的综合研究和分类的问题,描述了 50 种注意力技术分类的细节,并建议未来深度学习对注意力机制的研究方向。
Apr, 2022
视觉问答系统的注意力分析
本文结合注意力机制提出了两种最先进的视觉问答方法,并通过可视化和分析它们的估计注意力图来研究它们的鲁棒性和缺点。研究表明两种方法对特征敏感,同时对于计数和多对象相关的问题表现不佳。该研究结果和分析方法可帮助研究人员识别重要的挑战,以改进自己的 VQA 系统。
Oct, 2018
人工神经网络中的被动关注机制预测人类视觉选择性
通过 79 个实验和 7,810 个实验参与者的数据研究,揭示了同人类视觉选择性估计有显著重叠的被动关注技术,指出使用引导反向传播方法探测相对简单的神经网络架构产生的输入可视化是预测共享成分的最佳选择,这些结果帮助我们通过比较不同模型在图像信息选择性方面的相似性和差异性来评估领先的神经网络模型作为人类视觉模型的生物学和心理学的有效性。
Jul, 2021