Apr, 2022

WavFT: 利用标记和未标记数据微调声学模型

TL;DR本文介绍了一种使用无标签数据的有监督语音模型微调方法,达到了分类和上下文特征学习相结合的效果,并使用对比损失来学习音频表示,进而在古吉拉特语和孟加拉语上分别减少了 11.2% 和 9.19% 的错误率。