CVPRJul, 2019

2019 年 Activitynet 第三项任务:探索视频中复杂事件的背景

TL;DR本研究系统地探索了不同的视频字幕模型,提出了五种上下文和两类事件字幕模型,并从准确性和多样性两个角度评估了它们对事件字幕的贡献,该提出的字幕模型被插入到我们的管道系统中,本系统在视频任务的密集字幕事件上取得了最新颖的表现。