Sep, 2022

具有感知驱动优化和双重转换的语音增强

TL;DR本文提出了一种基于子带的语音增强系统,名为 PT-FSE,该系统通过对子带频谱图的操作来增强语音,其中包括全频带和子频带的融合模型、频率变换模块、时间变换和人类听觉感知的损失函数,实验结果表明,该系统达到了显著的改进,并且在基准数据集上优于当前最先进的技术。