Dec, 2023

利用语言识别计算中间 CTC 损失以增强代码交替语音识别

TL;DR通过在自动语音识别模型的编码器的中间层引入语言识别信息,本文旨在以更加隐式的方式生成暗示语言区别的声学特征,降低模型在处理语言切换时的混淆。