Oct, 2022

利用随机句子串联来提高短视频语音识别

TL;DR本文提出了一种称为随机语音串接(RUC)的方法,以缓解短视频语音识别任务中的训练 - 测试语音长度不匹配问题,实验证明使用该方法可明显提高模型性能,使得在 14 种语言上的平均词错误率降低了 3.64%。