May, 2023

使用预训练通用语音模型的参数高效阿拉伯语方言识别学习方法

TL;DR本文探讨了使用 Parameter-Efficient-Learning 技术将一种通用语音模型重新用于阿拉伯方言识别。通过在预训练设置下引入可训练的特征等不同设置来设计了多层编码器 - 解码器 GSM 架构,包括残差适配器和模型重新编程。针对阿拉伯语言中单词的发音和拼写变化大的问题,设计了标记级映射技术来为 GSM 调节阿拉伯方言识别。在 ADI-17 数据集上,通过普通的微调方法,实现了新的最先进准确率。我们进一步采用 PEL 方法降低了训练预算,只使用了额外网络可训练参数的 2.5% 就达到了与微调相当的准确率。我们的研究表明,使用开源代码和预训练模型,可以在数据集较小和计算资源有限的情况下进行阿拉伯方言识别。