Jul, 2020

基于知识的视频问答与无监督场景描述

TL;DR通过情节对话、生成视频场景描述和弱监督获取外部知识,ROL模型处理任务,使用变压器编码和模态权重机制,平衡不同来源的信息。通过对知识型视频故事问答的评估,ROL模型在KnowIT VQA和TVQA +两个挑战性问题数据集上表现出卓越的效果,是一种有前途的方法。