Nov, 2021

XLS-R: 在大规模自监督下进行跨语言语音表示学习

TL;DR本文介绍了 XLS-R,这是一个基于 Wav2vec 2.0 的用于跨语言语音表示学习的大规模模型,其在 128 种语言的近半百万小时的公开语音音频数据上进行训练,并取得了广泛的评估表现。我们的研究致力于提升语音处理任务在更多的世界语言上的表现。