Jan, 2016

基于循环神经网络的逐字递增语音识别

TL;DR本文提出了一种基于 RNN 的字符级增量语音识别系统,使用 CTC 进行端到端训练,在短时间内响应语音输入,通过基于树的在线 Beam Search 算法实现字级别的识别,该系统不仅能够响应不断输入的语音,还能根据发音来发音对语音的字词进行识别。在训练数据集上,该模型将字错率降低至 8.90%。