Mar, 2023
利用预训练的 AudioLDM 实现文本到语音生成:基准研究
Leveraging Pre-trained AudioLDM for Text to Sound Generation: A Benchmark Study
Yi Yuan, Haohe Liu, Jinhua Liang, Xubo Liu, Mark D. Plumbley...
TL;DR本文探讨了使用预先训练的 AudioLDM 模型作为声音生成的 “骨架” 在小数据量场景下实现优异表现的优势,并且比较了不同训练策略对模型性能的影响。同时,为了促进未来的研究,我们还在几个常用数据集上评估了各种文本生成语音系统,以允许公平比较和基准测试这些方法。