Jun, 2024
使用编码器提示进行多语言端到端语音识别的快速语言适应
Rapid Language Adaptation for Multilingual E2E Speech Recognition Using Encoder Prompting
Yosuke Kashiwagi, Hayato Futami, Emiru Tsunoo, Siddhant Arora, Shinji Watanabe
TL;DR通过引入自我条件 CTC 框架中的编码器提示技术,我们实现了 CTC 模型的语言特定适应,从而实现了多语言语音识别的端到端处理,并取得了平均错误率下降 28% 和低资源语言下降 41% 的显著效果。