Nov, 2022

TrimTail: 简单但有效的声谱长度惩罚实现低延迟流式自动语音识别

TL;DR本文提出了 TrimTail 方法,一种简单而有效的发射规则化方法,用于改善流式 ASR 模型的延迟。该方法可以在输入话语的频谱上直接应用长度惩罚以降低延迟,并可与各种模型结构和训练模式有效地结合使用。在几个数据集上进行测试表明,使用 TrimTail 方法可以显著地降低延迟并提高准确性。