Mar, 2018

大词汇连续语音识别的深度 FSMN

TL;DR本文介绍了改进的前馈顺序记忆网络 DFSMN 结构,通过在相邻层的记忆块之间引入跳过连接以启用跨不同层的信息流,并消除了建立非常深层结构时的梯度消失问题。在多个大型语音识别任务中,DFSMN 的性能优于 BLSTM,尤其是使用 CD-Phone 作为建模单元和较低帧率(LFR)进行训练时,DFSMN 的改进更为显著。此外,DFSMN 的记忆块的前瞻滤波器可以轻松地设计,以控制实时应用的延迟。