Mar, 2022

波斯幼儿语音评估的自动语音识别

TL;DR介绍了一种新的针对学前儿童语音测试的方法,通过加入 Random Frequency Pitch 目标到 Wav2Vec 2.0 模型的屏蔽目标中,在 Persian CommonVoice 数据集上达到了仅有 1.35 的字错误率,并在零次和少次测试中达到了积极的成果。