Nov, 2024

通过上下文知识检索与大语言模型改善字母到音素的转换

TL;DR本研究针对在文本到语音系统中,字母到音素转换过程中的歧义问题进行了探讨。研究提出了一种基于大语言模型的上下文知识检索方法,以提升字母到音素的转换精确度,实验结果表明,采用该方法的系统在性能上显著优于基线模型,尤其在Librig2p数据集上实现了音素错误率的显著降低。