May, 2024

基于 Wav2vec2.0 的自动语音识别领域适应中继续预训练在小学数学课堂环境下的应用

TL;DR通过持续预训练 (CPT),我们研究了将 Wav2vec2.0 调整到课堂领域的有效性,结果表明 CPT 是一个强大的工具,可以将基于 Wav2vec2.0 的模型的词错误率(WER)降低 10% 以上,改善了模型对不同噪声、麦克风、课堂条件以及学生群体的适应能力。同时,我们的 CPT 模型在标记微调数据中未见过的不同人群中展示了更好的泛化能力。