Apr, 2020

使用特征图缩放的改进型RawNet实现基于原始波形的语音识别中的文本无关说话人验证

TL;DR本研究提出了使用各种方法来缩放特征图的机制,包括使用sigmoid非线性函数采用缩放向量来乘法和加法缩放特征图,以及使用SincNet的sinc-convolution层替换第一卷积层,实验结果表明该方法有效,最佳表现的系统较原始RawNet减少一半的等误差率,并在VoxCeleb1-E和VoxCeleb-H协议下实现了优于现有最先进系统的扩展评估结果。