Feb, 2022

mSLAM:面向文本和语音的大规模多语言联合预训练

TL;DRmSLAM 是一种多语言语音和语言模型,通过在多种语言的大量无标记语音和文本上联合预训练学习跨语言跨模式表示。