Mar, 2022

十分钟领先同领域数据噪声鲁棒语音识别

TL;DR本文介绍了一种基于生成对抗网络(GAN)的噪声鲁棒性语音识别系统,只需使用 10 分钟的领域内无法匹配的嘈杂语音数据即可实现噪声谱的仿真。同时,我们还提出了一种双通道语音识别系统来提高在嘈杂环境下的稳健性能,实验证明所提出的系统通过 Simu-GAN 仿真噪声数据,比最佳基线在词错误率(WER)方面提高了 7.3%。