CVPRJun, 2019

双向时序图的目标感知聚合用于视频字幕生成

TL;DR本文提出了一种新的视频字幕生成方法 OA-BTG,该方法利用基于目标感知聚合和双向时间图 (OA-BTG) 来捕捉视频中显著目标的详细时间动态,从而学习具有区分性的时空表示。实验表明 OA-BTG 在 BLEU@4、METEOR 和 CIDEr 指标上达到了最先进的性能。