May, 2023

DC CoMix TTS:一种具有离散编码和混合器合作的端到端表现力语音合成技术

TL;DR本文提出了一种新的输入表示和简单体系结构,通过引入离散码到参考编码器的输入,利用音频压缩模型的向量量化器来实现改进的韵律建模。在主观和客观评估中证明了该方法的有效性,即离散码作为输入时参考编码器学习更好的说话人无关韵律。