Mar, 2022

模拟视觉对话中的指代关系

TL;DR本文提出两个基于人类对话语言知识和语境特征的软约束来改进模型的对话代词消解能力,将这两个约束嵌入到深度 transformer 神经架构中。实验结果显示出了本模型在 VisDial v1.0 数据集上相比于现有模型的性能提升,无需预训练其他视觉语言数据集。