ACLSep, 2021

GoG: 基于关系感知的图上图网络用于视觉对话

TL;DR本文提出了一种新颖的关系感知图嵌入模型(GoG)用于视觉对话,该模型可以捕获对话历史中的代词和依赖关系以及问题和图像对象之间的关系,实验结果表明我们的模型在生成式和判别式的对话任务中都取得了显著的优势。