Dec, 2023

利用正则表达式规范化立陶宛文本

TL;DR文本归一化是文本到语音合成系统的一个重要组成部分,需要识别并扩展非标准词以及应用适合立陶宛语的符号类别,基于正则表达式创建规则集并通过实验评估准确性,解释错误的原因并提供文本归一化规则发展的建议。