CVPRJun, 2020
清华大学人工智能联盟团队 2020 Activitynet 任务二技术报告:探索密集视频字幕的顺序事件检测
Team RUC_AIM3 Technical Report at Activitynet 2020 Task 2: Exploring Sequential Events Detection for Dense Video Captioning
Yuqing Song, Shizhe Chen, Yida Zhao, Qin Jin
TL;DR提出了一种用于密集视频字幕的事件序列生成模型,通过双向时间依赖在一次传递中生成事件边界来探索视频中的时间关系,避免了低效的两阶段提议生成,并在事件字幕模型中取得了最新的性能。