May, 2017

深度说话者特征学习用于文本非依赖型说话者验证

TL;DR本文研究使用卷积时延深度神经网络结构(CT-DNN)来学习说话人特征,实验结果表明 CT-DNN 可以产生高质量的说话人特征,即使使用单一特征(包括上下文的 0.3 秒),错误拒识率亦可低至 7.68%。