CVPRApr, 2024

自动化电影预告片生成

TL;DR我们提出了一种自动预告片生成框架,该框架通过自动化镜头选择和组合从完整电影中生成可信的预告片。我们的方法受到机器翻译技术的启发,将电影和预告片建模为镜头序列,从而将预告片生成问题形式化为序列到序列的任务。我们引入了 Trailer Generation Transformer(TGT),这是一个利用编码器 - 解码器架构的深度学习框架。TGT 电影编码器通过自注意力上下文化每个电影镜头表示,而自回归预告片解码器预测下一个预告片镜头的特征表示,考虑镜头在预告片中的时间顺序的相关性。我们的 TGT 在全面的度量套件上明显优于先前的方法。