May, 2020
记忆增强循环变压器用于连贯视频段落字幕生成
MART: Memory-Augmented Recurrent Transformer for Coherent Video
Paragraph Captioning
TL;DR我们提出了一种新的方法Memory-Augmented Recurrent Transformer (MART),它使用记忆模块来增强Transformer的结构,以更好地预测下一句话(关于指代和重复),从而鼓励连贯的段落生成。实验证明,MART生成的段落字幕比基线方法更连贯,更少重复,并保持与输入视频事件的相关性。