Aug, 2022

一种语言不可知的多语言流式本地化 ASR 系统

TL;DR本文提出了一种支持流式多语言的端到端自动语音识别的模型,通过编码端点模型和一个适用于语言混合的 End-of-Utterance Joint Layer,以及使用了更高效的 Embedding 解码器,实现了低延迟和高质量的效果,可以在移动设备上实时运行。