Jan, 2024

自动语音识别中的持续学习新词

TL;DR基于自我监督的持续学习方法,在自动语音识别系统中识别新词时表现出增长性能,通过使用来自之前工作中的增强型记忆自动语音识别模型,通过偏置模型向滑动中的新词进行解码,并对检测到的新词使用推理,将包含这些新词的话语收集到自适应数据集中,对该集进行持续学习,通过调整加到每个模型的权重矩阵上的低秩矩阵权重。该方法在新词经常出现时获得递增性能(超过 80% 的召回率),同时保持模型的一般性能。