EMNLPApr, 2020

稀疏图学习与知识迁移推理视觉对话

TL;DR本论文研究了视觉对话中的两个核心难题:对话历史下的语义结构推理和给定问题的多个合适答案的识别。为解决这些挑战,我们提出了 Sparse Graph Learning (SGL) 和 Knowledge Transfer (KT) 方法,使用了基于图结构学习的 SGL 推断出稀疏的对话结构,进而创新性地利用了 KT 以缓解单一答案标签限制模型获取多个合理答案的问题。结果表明,模型在 VisDial v1.0 数据集上具有比基线方法更强的推理能力,且表现优于现有的最先进方法。