EMNLPMar, 2020
Video2Commonsense: 生成通识描述以丰富视频字幕
Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning
Zhiyuan Fang, Tejas Gokhale, Pratyay Banerjee, Chitta Baral, Yezhou Yang
TL;DR通过生成视频常识描述(包括解释动机、影响和描述人物特点)的方法,结合开放式视频常识问答,可以提升通过字幕来理解视频的能力。