Jun, 2022

Dict-TTS: 带有先验字典知识的学习发音文本转语音

TL;DR本文提出了一种基于语义感知的生成文本到语音模型 Dict-TTS,该模型结合在线网站词典通过 S2PA 处理 module,实现了对多音字消除(polyphone disambiguation)的有效解决,同时提高了 TTS 系统的发音准确性及韵律建模,该模型在三种语言的实验结果显示优于其他基线模型。