CVPRMay, 2024
Diff-BGM: 视频背景音乐生成的扩散模型
Diff-BGM: A Diffusion Model for Video Background Music Generation
Sizhe Li, Yiming Qin, Minghang Zheng, Xin Jin, Yang Liu
TL;DR本文通过提出高质量的音乐视频数据集 BGM909 并进行详细注释和镜头检测,使用检索精确度度量标准来评估音乐质量,提出了 Diff-BGM 框架,以自动为给定的视频生成背景音乐,并引入片段感知交叉注意力层进行视频和音乐的顺序对齐,实验证明了我们提出方法的有效性。