Mar, 2022

XTREME-S: 评估跨语言语音表示

TL;DR该文章介绍了新的XTREME-S基准测试,其涉及语音识别,分类,语音到文本翻译和检索四大任务类别。该基准测试覆盖了10多种语言家族的102种语言与3个不同领域和4个任务家族,旨在简化多语言语音表示评估,并以XLS-R和mSLAM在所有下游任务中建立了第一个仅语音和语音文本基线。同时该基准测试旨在推动对“通用”的语音表示学习的研究,数据集和微调脚本可在提供的网址进行访问。