Sep, 2023

LeBenchmark 2.0:一种用于法语语音的标准化、可复制和增强的自监督表示框架

TL;DR该论文介绍了 LeBenchmark 2.0,一个用于评估和构建搭载自监督学习的法语语音技术的开源框架,其中包括大量不同类型的语料库,包含长达 14,000 小时的异构语音数据,十个预训练的 SSL wav2vec 2.0 模型,与社区共享的可学习参数介于 2600 万到 10 亿之间,并提供六个下游任务的评估协议以补充现有基准。LeBenchmark 2.0 还对针对语音的预训练 SSL 模型提供了独特的视角,包括冻结与微调的下游模型、任务不可知与任务特定的预训练模型,并讨论了大规模模型训练的碳足迹。