ICMLFeb, 2021

卷积层过滤器数量对语音识别模型准确度的影响

TL;DR通过研究卷积层的滤波器数目对 CNN+RNN 语音识别模型的预测准确率的影响,提出声音到向量嵌入 (CNN 嵌入) 的假设,并通过参数优化开发出一个轻型的 End-to-End 语音识别系统。该系统在仅有声学模型且无中间语音表示和语言模型的辅助下,仅含 4.4 百万权值参数就能够实现达到 90.2% 的字准确率,并且模型计算效率较高,也适用于移动设备或自动驾驶等场景。