ACLMay, 2020

记忆增强循环变压器用于连贯视频段落字幕生成

TL;DR我们提出了一种新的方法 Memory-Augmented Recurrent Transformer (MART),它使用记忆模块来增强 Transformer 的结构,以更好地预测下一句话(关于指代和重复),从而鼓励连贯的段落生成。实验证明,MART 生成的段落字幕比基线方法更连贯,更少重复,并保持与输入视频事件的相关性。