May, 2022

VD-PCR: 通过代词指代消解提高视觉对话

TL;DR本文中提出了 VD-PCR,这是一种提高视觉对话理解的新框架,旨在通过使用代词照应解决方法,包括隐式和显式方法。采用隐式方法,采用新的方法来执行代词照应解决和视觉对话任务的联合训练;采用显式方法,提出从代词和它们的指示物的指代关系识别历史轮的相关性,以便在视觉对话模型输入中明确修剪不相关的历史轮。通过所提出的隐式和显式方法,VD-PCR 在 VisDial 数据集上取得了最先进的实验结果。