BriefGPT.xyz
Nov, 2019
自监督预训练在语音识别中的有效性
Effectiveness of self-supervised pre-training for speech recognition
HTML
PDF
Alexei Baevski, Michael Auli, Abdelrahman Mohamed
TL;DR
本文比较了自监督表示学习算法 - 无量化学习和显式量化学习,发现使用显式量化的自监督学习算法以较高的准确性建立了数据词汇表,并在随后的BERT训练中学习了有效的表示方法,从而实现了训练量极小的语音识别系统。
Abstract
We present pre-training approaches for
self-supervised
representation learning
of speech data. A
bert
, masked language model, loss on disc
→