Apr, 2022
从舞蹈视频生成复杂音乐的量化生成对抗网络
Quantized GAN for Complex Music Generation from Dance Videos
Ye Zhu, Kyle Olszewski, Yu Wu, Panos Achlioptas, Menglei Chai...
TL;DRD2M-GAN 是一个基于多模态对抗网络的音乐生成框架,能够根据舞蹈视频生成对应的流行音乐等复杂风格,使用向量量化的音频表示,通过对多个数据集的评估,证明了此方法的有效性,并提供了一个使用 TikTok 视频的数据集用于未来相关研究的起点。