Apr, 2018

通过对抗学习实现说话者无关的训练

TL;DR本文提出了一种新的对抗多任务学习模型(即 Speaker-invariant training),旨在同时减少发言人的特征变异性并最大化其 Senone 区分性,以增强基于深度神经网络的自动语音识别系统性能,并通过对抗多任务学习来学习说话者不变且区分性 Senone 的深层特征。在此模型的基础上得到的结果比基于传统的对抗模型和 SI 模型组合的 ASR 系统结果更佳。