ICCVAug, 2017

多模式因式双线性池化与 Co-Attention 学习在视觉问答中的应用

TL;DR开发了一个多模式因式双线性池化(MFB)方法,通过 MFB 方法的融合和对视觉和文本信息的细粒度表示,结合协同注意力机制,在视觉问题回答中达到了最先进的成果。