Apr, 2020

说话人分离的概率嵌入

TL;DR利用从短时间内的语音中提取的说话人 embedding(x-vectors)在说话人辨识任务中进行了竞争性表现,本文在该方案中提取了对角精度矩阵,用于衡量声音质量,并构建了概率说话人 embedding,将其作为输入应用于 AHC 算法用于辨识,接口与 PLDA 模型,实现对参数进行联合判别训练,与基础算法相比提高了精度。