Oct, 2019

Speech-XLNet: 用于自我注意力网络的无监督声学模型预训练

TL;DR本文提出了一种无监督预训练方案 “Speech-XLNet”,利用 XLNet 进行自注意力网络(SAN)无监督预训练得到语音表示,可以在混合 SAN / HMM 框架下微调。实验表明,Speech-XLNet 相比于从随机初始化权重训练的模型,在 TIMIT 和 WSJ 任务中都能显著提高 SAN / HMM 的性能,包括收敛速度和识别准确性。