MMMay, 2023

CommonAccent:基于 Common Voice 的大型声学预训练模型探索口音分类

TL;DR本文介绍了使用 ECAPA-TDNN 和 Wav2Vec 2.0 / XLSR 体系结构进行多语言口音分类的简单操作方法,并以 Common Voice 数据集为基础,在英语、意大利语、德语和西班牙语上建立了新的最先进的英语口音分类。结果表明,将口音信息与 ASR 框架的其他部分相结合可以减轻口音识别错误。