BriefGPT.xyz
Jun, 2016
联合损失最小化训练具有循环应答单元的VQA模型
Training Recurrent Answering Units with Joint Loss Minimization for VQA
HTML
PDF
Hyeonwoo Noh, Bohyung Han
TL;DR
本文提出了一种基于循环深度神经网络的视觉问答算法,其中每个模块都对应着一个自身具备注意机制的完整的回答单元;该网络的优化基于所有单元汇聚起来的损失函数,同时这些单元共享模型参数,并接收不同信息来计算注意概率。实验结果表明,该算法在 VQA 数据集上的性能优于其他多步注意力机制。
Abstract
We propose a novel algorithm for
visual question answering
based on a
recurrent deep neural network
, where every module in the network corresponds to a complete answering unit with
→