Feb, 2023

JEIT: 语音识别的联合端到端模型和内部语言模型训练

TL;DR提出了一种使用大规模非配对文本来改善说话者对罕见单词的识别能力的训练方法 JEIT,它结合了端到端模型和内部语言模型训练,其中内部语言模型吸收非配对文本,接受 E2E 计算损失信息,从而提高 E2E 模型的性能。在 JEIT 过程中,MHAT 表现比 HAT 更佳,在 ILM 适应时更加稳定,此外,我们还提出了结合 JEIT 和 JOIST 的 CJJT 方法,它能更有效地实现语言模型的融合。