Apr, 2021

视觉语义角色标注用于视频理解

TL;DR使用视觉语义角色标注的新框架,将视频表示为相关事件的集合,引入VidSitu基准进行语义角色标注,通过事件-事件关系连接事件,研究了视频语义角色标注的挑战性任务,并对数据集进行了全面分析,与其他公开可用的视频理解基准进行了比较,评估了视频识别模型。