Jun, 2019

边际问题:面向说话人识别更具区分性的深度神经网络嵌入

TL;DR本研究介绍了三种基于边界的深度说话人嵌入学习损失函数,以实现更优的说话人辨识性能。在 VoxCeleb1 和 SITW 两个公共数据集上的实验证明了该方法比传统的交叉熵损失函数 softmax 具有更优的性能,分别在两个数据集上实现了 25%~30% 的等误差率 (EER) 降低,并分别获得了 2.238% EER 和 2.761% EER 的性能表现。