May, 2020

角色至上:基于角色感知关系的视频故事理解

TL;DR我们提出了一种基于人物感知关系的视频故事问题回答模型,它通过多示例共现匹配实现弱监督人脸命名,并利用 Transformer 结构支持高水平推理。我们在 TVQA 数据集上进行了训练和测试,并通过广泛的消融研究验证了我们提出的方法。