Jan, 2024

基于注意力偏置短语增强的情境化自动语音识别

TL;DR该论文提出了一种基于注意力的上下文偏置方法,利用可编辑的短语列表(称为偏置列表)来实现用户或开发人员的定制化,该方法通过组合偏置短语索引损失和特殊标记来有效地训练,以检测输入语音数据中的偏置短语。此外,为了进一步提高推理过程中的上下文化性能,我们提出了一种基于偏置短语索引概率的偏置短语增强(BPB)束搜索算法。实验结果表明,所提出的方法在 Librispeech-960(英文)和我们的内部(日文)数据集上一致改善了目标短语偏置列表的词错误率和字符错误率。