May, 2023

ML-SUPERB: 多语言语音通用性能基准

TL;DR本文提出的多语种 SUPERB (ML-SUPERB) 利用冻结的自我监督学习 (SSL) 特征和简单的框架,考虑了 143 种语言(从高资源到濒危),并考虑了自动语音识别和语言识别。我们发现语音 SSL 模型与 FBANK 特征相比可以显著提高性能,但我们发现多语种模型并不总是比它们的单语种模型表现更好。我们将发布 ML-SUPERB 作为挑战,以组织数据集和可复制的训练脚本,用于未来的多语种表示研究。