Jun, 2023

弱监督不完美转录下的自动语音识别:绕过时间分类

TL;DR提出了一种利用 Bypass Temporal Classification (BTC) 方法来扩大微调自动语音识别模型 (CNN) 准确性的算法,并且该算法构建了一个基于加权有限状态转换器 (WFST) 的可变性训练图来明确地编码训练期间的不确定性,从而改善了处理精度不高的语音资源库时 ASR 系统的健壮性和准确性。