May, 2023
DC CoMix TTS:一种具有离散编码和混合器合作的端到端表现力语音合成技术
DC CoMix TTS: An End-to-End Expressive TTS with Discrete Code Collaborated with Mixer
Yerin Choi, Myoung-Wan Koo
TL;DR本文提出了一种新的输入表示和简单体系结构,通过引入离散码到参考编码器的输入,利用音频压缩模型的向量量化器来实现改进的韵律建模。在主观和客观评估中证明了该方法的有效性,即离散码作为输入时参考编码器学习更好的说话人无关韵律。