Sep, 2024

预训练语言模型中的变压器作为自动语音识别编码器的有效性研究

TL;DR本文研究了变压器在预训练语言模型(PLMs)中作为自动语音识别(ASR)编码器的有效性,填补了这一领域的研究空白。研究表明,变压器在从文本数据中提取特征的能力可以有效转化为处理语音数据,从而显著提升ASR的性能。我们的实验结果显示,在多种ASR任务中,使用预训练语言模型的变压器能显著降低字符错误率(CER)和单词错误率(WER),尤其在需要深刻语义理解的场景中效果更为显著。