BriefGPT.xyz
Ask
alpha
关键词
phase reconstruction
搜索结果 - 3
使用修改的 DCT 频谱驯服基于 Transformer 的 GAN 进行语音超分辨率
提出基于 MDCT 的 mdctGAN SSR 框架,通过敌对学习在 MDCT 域中以相位感知的方式重构高质量的语音,无需使用语音编解码器或其他额外的后处理,实验结果显示该模型在各种输入速率下,实现了 48 kHz 目标分辨率下的最新的对数
→
PDF
a year ago
相位连续性:学习语音增强的相位频谱导数
本文提出了一种有效的相位重建策略,可以在嘈杂的环境中操作,通过将相位连续性损失考虑在最先进的神经语音增强系统中,本文证明了我们所提出的方法在训练过程中,可以显著提高增强语音信号的质量。
PDF
2 years ago
基于深度学习的说话人分离相位重建:三角函数视角
该研究采用深度学习对短时傅里叶变换领域中的单声道讲话人无关音频分离进行了相位重构实验,提出了三个基于迭代相位重构、组群延迟估计和相位差符号预测的算法,对公开的 wsj0-2mix 和 3mix 语料库进行了最先进的测试。
PDF
6 years ago
Prev
Next