Mar, 2022

基于目标特征的感知对比度拉伸语音增强

TL;DR本文提出了一种基于感知对比度拉伸 (PCS) 的方法来改善音频信号增强 (SE) 的性能,该方法通过对基于感知重要性的关键带重要性函数的目标特征的对比度进行拉伸,从而提高整体性能,并且可以与不同的 SE 模型架构和训练标准相结合,并且 PCS 不影响 SE 模型训练的因果性或收敛性,并可在 VoiceBank-DEMAND 数据集上实现最先进的性能。