Jan, 2024

用引导注意力改进 ASR 上下文偏见

TL;DR通过引入引导注意力(GA)辅助训练损失,本研究提出了一种改进自动语音识别(ASR)上下文偏置的有效性和鲁棒性的方法,该方法在不引入额外参数的情况下改善了偏置短语数量增加时上下文偏置所能带来的字错误率(WER)减少。通过在 Conformer Transducer with Contextual Adapter 基础上进行大量实验,证明了所提出的方法不仅能降低 WER,而且在偏置短语数量增加时仍然保持其有效性。