ACLMay, 2020
记忆增强循环变压器用于连贯视频段落字幕生成
MART: Memory-Augmented Recurrent Transformer for Coherent Video Paragraph Captioning
Jie Lei, Liwei Wang, Yelong Shen, Dong Yu, Tamara L. Berg...
TL;DR我们提出了一种新的方法 Memory-Augmented Recurrent Transformer (MART),它使用记忆模块来增强 Transformer 的结构,以更好地预测下一句话(关于指代和重复),从而鼓励连贯的段落生成。实验证明,MART 生成的段落字幕比基线方法更连贯,更少重复,并保持与输入视频事件的相关性。