Apr, 2022

从舞蹈视频生成复杂音乐的量化生成对抗网络

TL;DRD2M-GAN 是一个基于多模态对抗网络的音乐生成框架,能够根据舞蹈视频生成对应的流行音乐等复杂风格,使用向量量化的音频表示,通过对多个数据集的评估,证明了此方法的有效性,并提供了一个使用 TikTok 视频的数据集用于未来相关研究的起点。