Jul, 2015

使用Deep RNN模型和基于WFST解码的端到端语音识别

TL;DR本文介绍了 Eesen 框架,它简化了自动演讲识别系统的构建流程,并采用递归神经网络以及连接时序分类方法进行语音与标签序列的对齐,再基于 WFST 泛化解码的方式实现了自动语音识别,最终在保证较低错误率的情况下提升了识别速度。