CVPRMay, 2024

Diff-BGM: 视频背景音乐生成的扩散模型

TL;DR本文通过提出高质量的音乐视频数据集 BGM909 并进行详细注释和镜头检测,使用检索精确度度量标准来评估音乐质量,提出了 Diff-BGM 框架,以自动为给定的视频生成背景音乐,并引入片段感知交叉注意力层进行视频和音乐的顺序对齐,实验证明了我们提出方法的有效性。