Jan, 2022
Music2Video:音频和文本融合的自动生成音乐视频
Music2Video: Automatic Generation of Music Video with fusion of audio and text
Yoonjeon Kim, Joel Jang, Sumin Shin
TL;DR利用多模态特征空间中的文本和音频嵌入指导生成模型的生成图像,进一步实现音乐视频创作,我们提出的方法需要对视频进行自动分段,同时保持时间上的一致性,与以前的方法不同,我们的方法融合了文本和音频两个模态,展示了良好的应用效果