Feb, 2019

基于质心的深度度量学习用于说话人识别

TL;DR本研究通过利用神经网络将话语映射到一个距离反映说话人相似度的空间中的讲话人嵌入模型,优化了一种使用典型网络损失(PNL)的讲话人嵌入模型,从而优于基于三元组损失的模型,在见过和没见过讲话人的情况下,都能够在讲话人验证和识别任务中取得更好的性能