ACLApr, 2019

一种基于双向式文本到语音模型的新闻播报员声音合成方法,可适用于有限数据

TL;DR本文提出了一种用于合成新闻播报风格的少量数据语音合成模型,它不仅使用了目标风格的韵律变化,而且在上下文中使用词嵌入进行条件约束,与中立 NTTS 和基于连接的中立合成相比,这个模型缩小了新闻播报风格语音与中立语音合成之间感知的风格适宜性差距约三分之二。