Aug, 2017

超越双线性:面向视觉问答的广义多模态分解高阶池化

TL;DR本文利用深度神经网络中的协同注意机制与通用的多模式高阶因式化池化方法实现多模态特征的融合,使用 KL(Kullback-Leibler)散度作为损失函数,最终实现了优越的视觉问答表现。