Jul, 2022

低资源下克丘亚语自动语音识别的数据增强

TL;DR本篇论文描述了一种基于数据增强的方法,使用 wav2letter ++ 模型对 Quechua 进行语音识别的实验。通过将合成数据与文本增强相结合,将基本模型的识别错误率降低了 8.73%,最终 ASR 模型的识别错误率为 22.75%。