ICLROct, 2020

双模 ASR: 统一与改进全上下文流式 ASR 模型

TL;DR该研究提出了一种统一框架的双模 ASR(自动语音识别),通过权重共享和全场景 ASR 的联合训练,特别是在训练期间进行知识蒸馏,使流式 ASR 的延迟和准确性得到明显改善。该框架适用于最新的卷积和变压器 ASR 网络,并在 LibriSpeech 和 MultiDomain 数据集上进行了广泛实验和削减研究,取得了新的流式 ASR 结果。