May, 2023
ML-SUPERB: 多语言语音通用性能基准
ML-SUPERB: Multilingual Speech Universal PERformance Benchmark
TL;DR本文提出的多语种SUPERB (ML-SUPERB)利用冻结的自我监督学习 (SSL) 特征和简单的框架,考虑了143种语言(从高资源到濒危),并考虑了自动语音识别和语言识别。我们发现语音SSL模型与FBANK特征相比可以显著提高性能,但我们发现多语种模型并不总是比它们的单语种模型表现更好。我们将发布ML-SUPERB作为挑战,以组织数据集和可复制的训练脚本,用于未来的多语种表示研究。