Jun, 2022

利用对话历史的语言和韵律语境进行端到端共情对话语音合成的声学建模

TL;DR提出了一种综合考虑语言和韵律话语历史的共情式对话语音合成模型,通过预训练的自监督学习模型、引入韵律特征模型等手段,实现对话语境的适当预测,取得了优秀的语音合成效果。