Mar, 2023

LiteG2P: 一种快速轻量级高精度的字素到音素转换模型

TL;DR本文提出了一种名为 LiteG2P 的新颖方法,它将专家知识和神经网络相结合,可快速、轻量且理论上并行化,能用于云端和设备端。实验结果显示,该方法在参数数量上比基于 CTC 的现有方法少 10 倍,在计算量上比基于 Transformers 的序列到序列模型少 33 倍,在性能方面显着优于目前的基于 CTC 的方法,可用于自然语言处理中字母转语音的应用场景。