May, 2018

视觉问答的互注意融合

TL;DR该研究提出了一种新的注意力机制,同时考虑视觉细节的两个层次,即物体实例和它们的部分,通过高效的张量分解方案,设计了分层融合多模态信息的模型并提高了已有模型达到了一个显著的提升。