BriefGPT.xyz
大模型
Ask
alpha
关键词
waveform generation
搜索结果 - 3
ICLR
DiffWave:一种用于音频合成的通用扩散模型
本文介绍了 DiffWave,这是一种用于条件和非条件波形生成的多功能扩散概率模型。该模型高效地通过 Markov 链将白噪声信号转化为结构化波形,并通过特定的数据似然变分界限进行优化训练。DiffWave 在各种波形生成任务中均能生成高保
→
PDF
4 years ago
WaveGrad:用于波形生成的梯度估计
WaveGrad 是一种基于分数匹配和扩散概率模型生成波形的条件模型,它使用梅尔频谱来限制采样过程,并可通过调整迭代次数来平衡生成质量和速度。实验结果表明 WaveGrad 能够生成高保真度的音频样本,超越对抗样本和自回归模型,并通过少量的
→
PDF
4 years ago
Multi-band MelGAN:高品质文本转语音的快速波形生成
本研究提出了一种快速的多波段 MelGAN 模型,通过增加接收域、使用多分辨率 STFT 损失和多波段处理提高声音生成的质量和稳定性。结果表明,该模型在声波生成和 TTS 方面均取得了较高的 MOS 得分。
PDF
4 years ago
Prev
Next