CVPRJul, 2020

多模态视频问答的情感转移注意力网络

TL;DR该论文提出了一种称为模态转移关注网络的模型解决多模式视频问答任务,该模型对任务进行任务分解并使用时间提议网络和异构推理网络进行处理,通过模态转移进行任务的执行,这种模型在 TVQA 基准数据集上的实验结果表明它优于之前的最优性能,达到 71.13%的测试准确率,并开展了广泛的消融研究和定性分析以验证网络的各个组件。