Jul, 2021

CLSRIL-23: 面向印度语言的跨语言语音表示

TL;DR本研究提出了 CLSRIL-23,一种基于自监督学习的音频预训练模型,可以在23种印度语言的原始音频中学习跨语言的语音表示。在预训练期间,将语言特定的语音表示分别比较以比较单语和多语预训练的效果。我们的实验证明,多语预训练优于单语预训练,能够学习对语言进行编码并在下游任务中达到更好的性能。