Feb, 2018

卷积神经网络神经预测编码实现演讲者特征无监督学习

TL;DR本研究提供了一种新方法 —— 神经预测编码(NPC),以从大量无标注的训练数据中完全无监督地学习说话人特征,该方法利用了所提出的短期主动说话人平稳假设,即将两个时间上接近的短语音片段规定为同一说话人,从而训练卷积深度连体网络,通过学习区分在未标记的语音流数据中生成的 “相同” 和 “不同” 说话人对,生产 “说话人嵌入”,从而在短持续时间实验中表现最佳,并为完整话语实验提供补充信息。