NIPSNov, 2018

基于 SincNet 的可解释卷积滤波器

TL;DR本研究提出了一种新的卷积神经网络模型 ——SincNet,该模型可用于直接处理从原始波形中提取的语音,通过使用参数化 sinc 函数,鼓励第一层学习更有意义的滤波器,学习带通滤波器的低高截止频率可以从数据中直接进行,该模型比标准 CNN 模型具有更快的收敛速度,更好的性能和更好的可解释性,这在说话人识别和语音识别方面得到了很好的实验验证。