Nov, 2022

针对语音识别的房间脉冲响应估计的改进

TL;DR本研究提出了一种基于生成敌对网络(GAN)的结构,通过编码反射语音中的 RIR 特征并构建 RIR,使用新颖的能量衰减缓解损失来优化模型,从而提高自动语音识别(ASR)系统的性能,实验证明该模型在声学基准测试和 ASR 评估任务中都比现有模型表现更好。