Mar, 2024

透过零训练样本的情感和言语阻碍生成实现人性化的语音合成

TL;DR现代对话系统在情感深度和人类交互特征方面存在重大局限。为弥补这一差距,我们设计了一种创新的语音合成流程,通过零 - shot 设置下的先进语言模型将人类情感和不流畅的特质引入生成的文本,从而更好地模拟人类语音模式,提供更直观自然的用户交互,产生几乎无法与真实人类交流区分的合成语音,使每次交互更具个人化和真实性。