AAAIDec, 2019

DMRM: 用于视觉对话的双通道多跳推理模型

TL;DR提出了一种新的视觉对话模型 DMRM,通过双通道多跳推理结合多模态注意力,有效地将问题、图像和历史上下文信息融合,从而提高了视觉对话的生成质量。在 VisDial v0.9 和 v1.0 数据集上,DMRM 模型的实验结果表明,相比较其他模型,DMRM 模型具有更好的效果。