Jan, 2024

使用多个softmax上的注意力的流式双语端到端自动语音识别模型

TL;DR本文介绍了一种新颖的双语端到端模型,通过共享编码器和预测网络,并通过自注意机制组合语言特定的联合网络,实现了单一神经模型对多种语言的识别和支持语言之间的动态切换,相比传统双语基线模型,该方法在印地语、英语和混合代码测试集上分别降低了13.3%、8.23%和1.3%的词误差率。