Sep, 2019

多语种图音融合 ASR 与大规模数据增强

TL;DR本文介绍了一种单一的基于字形的ASR模型,采用标准的混合BLSTM-HMM声学模型以及晶格自由MMI目标进行学习,能对七种语言进行无歧义的识别,并且比每个单一语言的ASR模型表现更佳。同时,我们还评估了多种数据增强的方法,并且展示了这种提出的多语言字素混合ASR与各种数据增强不仅能识别任何训练集内的语言,还能大大提高ASR性能。