Sep, 2023

HiFTNet:具备谐波加噪滤波器和逆短时傅里叶变换的高速高质量神经声码器

TL;DR本文介绍了一种名为 HiFTNet 的扩展模型,通过在时频域中使用基频(F0)的正弦源来快速推理,结合了反短时傅里叶变换(iSTFT)和谐波加噪声源滤波器,实现了高效、高质量的神经音频编码,为实时高质量语音合成应用开辟了新的前景。