Apr, 2013

使用卷积神经网络从原始语音信号估计音素类条件概率

TL;DR本文探究一种利用卷积神经网络(CNN),以原始语音信号作为输入、输出为音素类别条件概率估计的新方法,比较其在 TIMIT 音素识别任务中的表现,发现该方法可以获得与传统方法相当或更好的音素识别性能,表明 CNN 可以自动从原始语音信号中学习与音素分类相关的特征。