Feb, 2023

利用辅助 CTC 目标提高大规模多语言 ASR 性能

TL;DR本篇研究探讨自动语音识别中多语言不平衡性的问题,并使用语言标识条件来改善性能,并采用自我监督模型和 Conformer 架构实现相对于先前工作的 28.4% 的 CER 的最新系统。