ACLApr, 2021

通过语义角色的短语实现视频问答

TL;DR本研究提出使用视频描述中的语义角色来在模型评估中引入填充短语任务,以改进现有的 VidQA 模型评估方式,并构建了 ActivityNet-SRL-QA 和 Charades-SRL-QA 数据集,通过扩展三种视觉语言模型进行了基准测试,并且进行了大量分析和研究以指导未来的研究工作。