Oct, 2019

vq-wav2vec:离散语音表示的自我监督学习

TL;DR该研究提出了vq-wav2vec算法,用于学习音频片段的离散表示,并通过自监督上下文预测任务实现。实验结果表明,BERT预训练在TIMIT音素分类和WSJ语音识别方面实现了新的最优结果。