Dec, 2020

DeCoAR 2.0:具有向量量化的深度语境化声学表示

TL;DR文章介绍了使用语音表征学习的方法在没有标签的数据上训练语音识别模型的新方法 DeCoAR 2.0。该模型采用 Transformers 编码模型,引入了向量量化层来对语音表征进行训练,并在多个数据稀疏的场景下表现出一致的提高。