Jun, 2020

无监督跨语言表示学习用于语音识别

TL;DRXLSR 是一种学习跨语言语音表示的模型,通过对多种语言的语音原始波形进行预训练来构建模型,上述模型建立在 wav2vec 2.0 的基础之上,可以使用单一模型完成多语言语音识别任务,并且具有更好的性能。