Jul, 2024

中文语音识别中大语言模型的拼音规范化纠错

TL;DR最近的研究表明大型语言模型在自动语音识别的纠错方面的有效性,但大部分研究集中在英语上。本文将目光转向中国语言,并构建了一个专门用于纠正中文自动语音识别错误的基准数据集,其中包含了广泛的场景和显著的挑战。随后,我们使用该数据集进行了初步评估,包括直接提示和微调预训练的大型语言模型。此外,我们提出了一种简单的拼音规范化方法,通过从文本假设直接转录拼音。实验结果显示,与没有规范化的情况相比,拼音规范化始终提升了大型语言模型的纠错能力。该数据集已经在网站上提供。