Mar, 2022

FullSubNet+:利用复数谱的通道注意力 FullSubNet 进行说话增强

TL;DR本文提出了一种扩展的单通道实时语音增强框架 FullSubNet+,采用了轻量级多尺度时间敏感通道注意力 MulCA 模块、全幅值、实部与虚部谱图作为输入以充分利用噪声语音中的相位信息、以及用时序卷积网络块(TCN)替换原先的长短期记忆层的全幅模型,其在 DNS 挑战数据集中表现优越,达到了最先进的性能并优于其他现有语音增强方法。