EMNLPNov, 2023

多语言自学习语音表示改进资源有限的非洲语种混杂语音识别

TL;DR利用自监督语音表示的微调和利用转录训练的 n-gram 语言模型增强多语言表示,相对于从头开始训练的混合模型,将代码切换数据的绝对词错误率降低了高达 20%。研究结果表明,在训练数据受限的情况下,微调自监督表示是一种更优秀和可行的解决方案。