CVPRJun, 2019
双向时序图的目标感知聚合用于视频字幕生成
Object-aware Aggregation with Bidirectional Temporal Graph for Video Captioning
Junchao Zhang, Yuxin Peng
TL;DR本文提出了一种新的视频字幕生成方法 OA-BTG,该方法利用基于目标感知聚合和双向时间图 (OA-BTG) 来捕捉视频中显著目标的详细时间动态,从而学习具有区分性的时空表示。实验表明 OA-BTG 在 BLEU@4、METEOR 和 CIDEr 指标上达到了最先进的性能。