Apr, 2023

基于近似最近邻短语挖掘的语境语音识别

TL;DR本文介绍了一种使用从上下文编码器的潜在空间中挖掘负短语的简单且高效的方法来训练端到端上下文感知 Transformer Transducer (CATT) 模型的扩展方法。通过包含 ANN-P (近似最近邻短语) 在上下文列表中,我们鼓励学习到的表示来区分类似但不完全相同的偏见短语,从而改善了偏见精度。在大规模数据情况下进行实验,获得了测试数据上上下文部分高达 7%的相对词误差率降低。我们还扩展和评估了 CATT 方法在流应用程序中的效果。