Jan, 2023

Moûsai: 长上下文潜在扩散的文本生成音乐

TL;DR本研究探索了扩散模型在生成音乐方面的潜力,提出了一种级联的潜在扩散方法来根据文本描述生成高质量的立体声音乐,同时开源相关代码和音频样本以促进领域内未来研究。