Jun, 2024

面向成千上万种语言的鲁棒语音表征学习

TL;DR我们提出了XEUS,一种用于普适语音的跨语言编码器,通过对来自4057种语言的超过1百万小时数据进行训练,将SSL模型的语言覆盖范围提高了4倍,并在多项基准测试中展现出优于或与最先进的SSL模型的可比结果。