Dec, 2023
利用语言识别计算中间 CTC 损失以增强代码交替语音识别
Leveraging Language ID to Calculate Intermediate CTC Loss for Enhanced Code-Switching Speech Recognition
Tzu-Ting Yang, Hsin-Wei Wang, Berlin Chen
TL;DR通过在自动语音识别模型的编码器的中间层引入语言识别信息,本文旨在以更加隐式的方式生成暗示语言区别的声学特征,降低模型在处理语言切换时的混淆。