ICCVAug, 2017
多模式因式双线性池化与 Co-Attention 学习在视觉问答中的应用
Multi-modal Factorized Bilinear Pooling with Co-Attention Learning for Visual Question Answering
Zhou Yu, Jun Yu, Jianping Fan, Dacheng Tao
TL;DR开发了一个多模式因式双线性池化(MFB)方法,通过 MFB 方法的融合和对视觉和文本信息的细粒度表示,结合协同注意力机制,在视觉问题回答中达到了最先进的成果。