Mar, 2023

利用预训练的 AudioLDM 实现文本到语音生成:基准研究

TL;DR本文探讨了使用预先训练的 AudioLDM 模型作为声音生成的 “骨架” 在小数据量场景下实现优异表现的优势,并且比较了不同训练策略对模型性能的影响。同时,为了促进未来的研究,我们还在几个常用数据集上评估了各种文本生成语音系统,以允许公平比较和基准测试这些方法。