Sep, 2024

VMAS:通过语义对齐在网络音乐视频中生成视频音乐

TL;DR本研究解决了从视频生成背景音乐的方法缺乏多样性和符号音乐注释不足的问题。提出了一种新颖的生成视频音乐Transformer及语义对齐方案,使得生成的音乐能够与视频内容高度一致。该方法在2.2M的视频音乐样本数据集上表现优越,具有广泛的应用潜力。