BriefGPT.xyz
Nov, 2017
用于视觉问答的高阶注意力模型
High-Order Attention Models for Visual Question Answering
HTML
PDF
Idan Schwartz, Alexander G. Schwing, Tamir Hazan
TL;DR
本文提出了一种新颖且通用的注意力机制,可以学习不同数据模态之间的高阶相关性。 作者实验证明高阶相关性可以将适当的关注点引导到不同数据模态中的相关元素,来更好地解决联合任务,如视觉问答(VQA),在 VQA 标准数据集上实现了最先进的性能。
Abstract
The quest for algorithms that enable
cognitive abilities
is an important part of
machine learning
. A common trait in many recently investigated cognitive-like tasks is that they take into account different
→