Feb, 2022

基于后验分布适应的混合 CTC / 注意力系统的端到端上下文 ASR

TL;DR该研究针对 End-to-end 语音识别模型在识别罕见专有名词上性能较差的问题,提出了一种基于上下文偏置注意力的改进方案。该方案通过在注意力编码器解码器模型中添加上下文偏置注意力模块,使模型有能力识别上下文短语。在 GigaSpeech 数据集上的实验结果表明,该方法相比基线模型,提高了 15%至 28%的偏置短语召回率,并且拥有较强的反偏置能力。