May, 2022

基于树约束指针生成器的上下文 ASR 中减小偏置词误差

TL;DR本文提出了一种基于 “TCPGen” 的端到端自适应语音识别模型,在训练和测试中引入外部语境信息和偏置词列表,并通过构建符号前缀树和优化偏置词错误率等手段,显著提高了长尾高价值词汇识别准确率,甚至在未出现在已知数据集中的词汇上也取得了较大的进展。