Feb, 2022

利用 Detect and Pass 增强有限数据的口吃语音 ASR

TL;DR为解决语音助手对口吃 (Speech Disorder) 人士不友好的问题,研究提出了一种简单高效的称为 “Detect and Pass” 的算法,它通过一个上下文相关的对口吃音频帧分类器,对口吃的音频进行筛选,再将这些筛选的结果传递到 ASR 模型中提高其错误率的鲁棒性。该研究表明在不同的 ASR 系统上,WER 的降低幅度达到了 23.93% 到 71.67%.