Aug, 2020

具有移动音频流网络的高效低延迟语音增强

TL;DR提出了适用于移动设备和计算能力受限应用的移动音频流网络 (MASnet),用于有效的低延迟语音增强。MASnet 将连续的嘈杂帧转换为复值比率掩码,然后将其应用于相应的嘈杂帧。与类似的全卷积架构相比,MASnet 采用了深度和点卷积,大大减少了每秒融合乘累加运算次数 (FMA/s),但牺牲了一些信噪比。