Oct, 2019

基于 Transformer 的混合语音识别声学建模

TL;DR本文提出并评估了基于 transformer 的声学模型在混合语音识别中的应用。通过讨论不同的建模选择,包括各种位置嵌入方法及迭代损失等,我们证明了在 Librispeech 基准测试中使用 transformer 模型相比其他模型性能更优越,且结合神经网络进行二次评分,我们的方法可以达到最先进的结果。