Mar, 2022

CUSIDE:基于分块、模拟未来上下文和解码的流式 ASR

TL;DR本文提出了一种新的框架(Chunking、模拟未来内容和解码,CUSIDE)用于流式语音识别,引入了模拟模块来递归模拟未来上下文帧,通过自监督损失与 ASR 模型联合训练,证明在维持识别准确度的同时大幅降低延迟,并在 AISHELL-1 数据集上取得了新的最佳的流式 ASR 结果。