Jun, 2024

表达性语音合成的风格混合专家模型

TL;DR该研究提出了 StyleMoE 方法,通过将风格编码器建模的嵌入空间划分为可处理的子集,然后由专家处理。实验结果明确展示了该方法在增加多样且未知风格的风格空间覆盖方面的有效性,能够提升现有领先的风格转换语音合成模型的性能,并首次将 Mixture of Experts 引入风格转换语音合成转换领域。