NIPSMay, 2018

双线性注意力网络

TL;DR本研究提出了一种基于双线性注意力网络的多模态学习方法,通过提取双线性交互特征来优化多模态输入的注意力分布,以提高视觉问题回答(VQA)和 Flickr30k 数据集上的性能表现。