Aug, 2018
半监督训练以提高端到端语音合成的数据效率
Semi-Supervised Training for Improving Data Efficiency in End-to-End Speech Synthesis
Yu-An Chung, Yuxuan Wang, Wei-Ning Hsu, Yu Zhang, RJ Skerry-Ryan
TL;DR本文提出了一种半监督的训练框架来提高 Tacotron 数据效率,通过利用大量的公开文本和语音语料库的文本和声学知识,该框架使 Tacotron 能够使用不到半小时的配对训练数据生成可理解的语音。