Dec, 2023

CONCSS: 对话语音合成中基于对比的上下文理解技术

TL;DR在本研究中,我们引入了一种基于对比学习的对话语音合成 (CSS) 框架 CONCSS,利用一种创新的预训练任务来进行自监督学习,提升模型对对话语音数据集的上下文理解能力,并引入了一种负样本扩充的采样策略来增强上下文向量的区别性,实验结果表明我们提出的方法合成的语音具有更加上下文适应和敏感的音调。