Jun, 2024

先自主训练再转录

TL;DR研究表明,对于训练和测试领域不匹配的情况下,当前的语音识别系统会显示出较大的性能下降。自我训练方法可以帮助解决这个问题,并在域漂移的情况下使模型适应。本文调查了在测试集上进行噪声学生教师训练作为测试时自适应方法的效益,类似于语言模型的动态评估方法,它可以在话语边界之间传递信息并作为一种域适应方法。实验中使用了一系列领域内和领域外数据集,展示了高达 32.2%的相对增益。有趣的是,我们的方法显示出比典型的自我训练设置使用单独的适应数据的更大增益。