Jul, 2022

低资源下克丘亚语自动语音识别的数据增强

TL;DR本篇论文描述了一种基于数据增强的方法,使用wav2letter ++模型对Quechua进行语音识别的实验。通过将合成数据与文本增强相结合,将基本模型的识别错误率降低了8.73%,最终ASR模型的识别错误率为22.75%。