Sep, 2023

评估基于学习的语音增强系统在嘈杂和混响环境中的泛化差距

TL;DR通过引入参考模型以作为测试条件困难性的代理,本研究提出了一个泛化性能评估框架,旨在准确评估具有嘈杂和混响特性的语音增强系统。通过在多个语音、噪声和 BRIR 数据库之间进行交叉验证,准确估计了泛化间隙,发现对于 FFNN、Conv-TasNet、DCCRN 和 MANNER 等模型而言,匹配语音条件下的性能最好,而在不匹配条件下,性能明显下降,甚至不如基于 FFNN 的系统。