Dec, 2022

情感可选的端到端基于文本的语音编辑

TL;DR本文旨在为基于文本的语音编辑任务中生成带有情感效果的语音提供一种新方法,我们提出了 Emo-CampNet 模型,它可以根据上下文的情况引入额外的情感属性,以控制所生成语音的情感。此外,我们还提出了数据增强方法和一种去除原始语音情感的中性内容生成器,以丰富模型的训练集并避免情感干扰。实验结果表明 Emo-CampNet 模型可以有效地控制语音情感并编辑无标记说话人的语音。