Dec, 2021

自监督学习用于语音识别中间层辅助训练

TL;DR利用中间层监督自监督学习(ILS-SSL)对语音预训练模型进行优化,可以更好地集中于音频内容信息学习,从而实现识别性能的提高,并且在语言模型不被使用情况下,相对字错率下降23.5%。