KDDApr, 2023

TCR: 基于注意力细化的短视频标题生成及封面选择

TL;DR本文介绍了一种名为 Short Video Title Generation (SVTG) 的真实数据集,以及一种应用多模态信息的 Title generation and Cover selection with attention Refinement (TCR) 方法,通过对高质量样本和高相关性帧和文本令牌进行精细化训练,该方法在生成标题和选择封面方面优于现有的各种视频字幕方法,并且可以针对真实短视频选择更好的封面。