Jun, 2023

基于预训练语言模型和基于停顿的韵律建模的自然语音合成 (PauseSpeech)

TL;DR本文提出了一个基于已预训练语言模型和基于停顿的语调模型的语音合成系统 PuaseSpeech,其使用编码器和预测器来实现词语分组和停顿的建模,实验结果表明 PuaseSpeech 在自然度方面优于先前的模型。