Apr, 2022

使用 ByT5 模型进行大规模多语言字素到音素转换

TL;DR使用 ByT5 模型,我们从不同来源中整理出覆盖 100 种语言的 G2P 数据集,并训练了大规模的多语种 G2P 模型。与单语模型相比,多语种 ByT5 模型通过同时学习多种语言降低了电话错误率,可进一步通过无监督预测或微调,帮助低资源语言的写作转音。