Jun, 2024

使用编码器提示进行多语言端到端语音识别的快速语言适应

TL;DR通过引入自我条件 CTC 框架中的编码器提示技术,我们实现了 CTC 模型的语言特定适应,从而实现了多语言语音识别的端到端处理,并取得了平均错误率下降 28% 和低资源语言下降 41% 的显著效果。