Oct, 2013

局部特征或梅尔频率倒谱系数——对于基于MLN的孟加拉语语音识别哪种更好?

TL;DR本文讨论了基于本地特征方法的神经网络模型在孟加拉语音识别中的应用,通过输入语音信号并从中提取本地特征,利用多层神经网络提取音素矩阵,然后对音素进行分类,实现更高效、更准确的自动语音识别系统。本系统相较于基于MFCC的系统具有更高的音素识别率且需要更少的HMM混合成分。