May, 2022

SDS-200: 一份瑞士德语转标准德语文本语料库

TL;DRSDS-200 是一份包含瑞士德语方言语音的语料库,其中标注了方言、年龄和性别等信息,可以用于训练语音翻译、方言识别和语音合成系统等。该数据集包含约 4000 名不同说话者的 200 小时的语音,并覆盖了瑞士德语方言的大部分领域。我们同时发布了 SDS-200 基线语音翻译模型和使用 SDS-200 微调预训练的 XLS-R 模型,最终达到了 21.6 WER 和 64.0 BLEU。