Jul, 2018

使用 SincNet 从原始波形中进行说话人识别

TL;DR本文介绍了一种新的卷积神经网络架构,称为 SincNet,它使用基于参数化的 sinc 函数实现带通滤波器,以从原始的语音样本中学习低级别的语音表征,以更好地捕捉重要的窄带说话人特征,实验表明,该网络架构比标准的 CNN 在原始波形上更快地收敛并且表现更好。