Jun, 2024

基于 CWT 的语音合成中的 Mel 频谱增强范式

TL;DR基于连续小波变换的 Mel 频谱增强范式可提高合成语音的质量,与基线模型相比,该增强范式在自回归和非自回归语音系统中实验结果表明合成语音的 MOS 得分提高了 0.14 和 0.09,为增强范式广泛适用性提供了验证。