Oct, 2023

多语音识别中的代码切换适配器适应

TL;DR本文提出了在代码转换的语音中有效地微调大型预训练多语言语音模型的方法,并将代码转换建模为一系列潜在的二进制序列,以引导每个语言适配器在帧级别上的信息流,通过在阿拉伯语、普通话和印地语等多种语言与英语配对的数据集上的评估,显示出代码转换性能的持续改进,至少可以将语音识别错误率 (CER) 降低 10%。