EMNLPMar, 2020

Video2Commonsense: 生成通识描述以丰富视频字幕

TL;DR通过生成视频常识描述(包括解释动机、影响和描述人物特点)的方法,结合开放式视频常识问答,可以提升通过字幕来理解视频的能力。