Feb, 2022

可学习非线性压缩用于稳健扬声器验证

TL;DR本研究基于深度神经网络,针对演讲者验证中的非线性压缩方法在光谱特征中的应用进行了探究,并提出了一种多区域设计的非线性压缩方法,通过实验证明与常用的对数方法相比,在 VoxCeleb1 和 VoxMovies 数据集上,基于功率函数的压缩方法的性能得到了很大提高,并且在 VoxMovies 数据集上,相比静态压缩方法,我们的多区域设计方法提供了更好的稳健性。