CVPRJun, 2020

清华大学人工智能联盟团队 2020 Activitynet 任务二技术报告:探索密集视频字幕的顺序事件检测

TL;DR提出了一种用于密集视频字幕的事件序列生成模型,通过双向时间依赖在一次传递中生成事件边界来探索视频中的时间关系,避免了低效的两阶段提议生成,并在事件字幕模型中取得了最新的性能。