关键词minimum word error rate
搜索结果 - 2
- 神经背景性偏倚的文本插入
通过上下文中注入文本的方式,使用大规模未配对的文本来优化自动语音识别(ASR)模型及其偏置成分,提高重要短语的识别准确率。实验证明,使用 1000 亿个文本句子进行 CTI,相对于强大的神经偏置模型,可以实现高达 43.3% 的相对词错误率 - 非自回归推理的流式对齐调整
提出了一种流式非自回归(non-AR)解码算法,其利用新型变换器解码器架构在每个帧上执行文本和音频的本地自我关注,并在每个层上进行时间对齐的交叉关注,实现了高效率和低延迟,在声音搜索数据集和 Librispeech 上的实验显示,我们的流式