Jun, 2022

Wav2Vec-Aug: 有限数据下的改进自监督训练

TL;DR本文探讨了如何利用数据增强技术来解决语言和领域中数据不足的问题,从而在限制条件下将自监督学习应用于语音表示方面,并在 Wav2Vec 2.0 预训练模型的每个组成部分上提出了改进方法,在 Librispeech 的测试任务中比 Wav2Vec 2.0 实现了 13%的相对字错误率改进。