Nov, 2017

从原始语音中学习滤波器组以进行语音识别

TL;DR通过对原始波形进行滤波及卷积神经网络训练,使得时域滤波器组近似于 Mel 滤波器组,并在 TIMIT 上的电话号码识别实验中,相较于使用 Mel 滤波器的模型,TD-filterbanks 在多个架构上均表现优异,这些滤波器在收敛时具有非对称脉冲响应,且一些滤波器几乎保持解析的情况。