Jun, 2021

EMOVIE:一种普通话情感语音数据集及其简单情感文本转语音模型

TL;DR本篇论文提供了包括 9,724 个样本的情感语音数据集,并提出了一种名为 EMSpeech 的情感语音合成模型,该模型无需参考音频即可从文本预测情感标签并生成更富表现力的语音。在实验中,作者验证了数据集的有效性,证明了该模型在情感语音合成任务中取得了显著性能。