Mar, 2022

Mixed-Phoneme BERT: 用混合音素和超音素表示增强文本到语音的 BERT 模型

TL;DR本文提出了使用混合音素和超音素表示来增强 BERT 模型的学习能力的 MixedPhoneme BERT,该模型将相邻的音素合并为超音素,并将音素序列和超音素序列组合作为模型输入,从而在文本到语音合成中获得了显着的性能提升并且速度快 3 倍。