Jul, 2023

通过学习语音录音中的发音来改进字素转音元

TL;DR通过从音频记录中学习发音示例来改善 G2P 转换任务的方法,利用少量带有注释的示例训练 G2P 模型,使用多语言电话识别系统进行解码,学习对于未收录词汇的发音字典,并重新训练 G2P 系统,该方法在不同语言和数据量的情况下持续提高 G2P 系统的音素错误率。