Feb, 2023

MoLE: 用于多语言自动语音识别的语言专家混合模型

TL;DR本文提出了一种名为 Mixture-of-Language-Expert(MoLE)的多语言语音识别网络,它可以在任意语言的输入语音中分析语言表达并激活轻量级语言标记令牌工具来估计其激活的可靠性,然后根据语言特定专家的激活和语言不可知专家进行语言条件嵌入以有效识别声音,实验证明该模型对于低资源语言的多语言识别具有优势。