BriefGPT.xyz
大模型
Ask
alpha
关键词
neural vocoding
搜索结果 - 3
HiFTNet:具备谐波加噪滤波器和逆短时傅里叶变换的高速高质量神经声码器
本文介绍了一种名为 HiFTNet 的扩展模型,通过在时频域中使用基频(F0)的正弦源来快速推理,结合了反短时傅里叶变换(iSTFT)和谐波加噪声源滤波器,实现了高效、高质量的神经音频编码,为实时高质量语音合成应用开辟了新的前景。
PDF
9 months ago
Vocos:面向高质量音频合成的时域和傅里叶神经声码器之间的差距的缩小
本研究提出了 Vocos 模型,该模型利用基于傅里叶变换的时频表示解决了复杂值谱图的直接重建问题,并显著提高了计算效率,具有与时域神经编码方法相媲美的音频质量和具有频率感知能力的生成器。
PDF
a year ago
UnDiff: 无监督语音恢复与无条件扩散模型
本文介绍了 UnDiff,一种扩散概率模型,能够解决各种语音反问题,并可以应用于条件不同的任务,如降级反演、神经声波编解码和语音来源分离等。首先,我们比较了不同的神经架构和预处理方法来解决无条件波形生成的难题,并通过最新的扩散模型后处理技术
→
PDF
a year ago
Prev
Next