Mar, 2022

XTREME-S: 评估跨语言语音表示

TL;DR该文章介绍了新的 XTREME-S 基准测试,其涉及语音识别,分类,语音到文本翻译和检索四大任务类别。该基准测试覆盖了 10 多种语言家族的 102 种语言与 3 个不同领域和 4 个任务家族,旨在简化多语言语音表示评估,并以 XLS-R 和 mSLAM 在所有下游任务中建立了第一个仅语音和语音文本基线。同时该基准测试旨在推动对 “通用” 的语音表示学习的研究,数据集和微调脚本可在提供的网址进行访问。