ECCVJul, 2020

从视频学习生成音乐的福利音乐

TL;DR本文介绍了 Foley Music 系统,该系统能够为视频生成逼真的音乐。该系统将视频转换为基于运动的 MIDI 事件,然后利用 Graph-Transformer 框架精确地预测 MIDI 事件序列并转换为逼真的音乐,同时还具有完全可解释和透明的 MIDI 表示形式,可以实现灵活的音乐编辑。实验结果表明,该系统在生成宜人的音乐方面优于现有的几个系统。