Sep, 2023

通过内容传递减少数据分布恢复步骤以加快扩散模型中的语音合成

TL;DR通过使用扩散过程中前向时间步的不同输出作为目标,该论文提出了一种降低预测误差幅度、减少训练时间的方法,通过神经网络层逐步去噪最终生成清晰音频,该技术在时间效率和音频质量上超越了现有的先进工具并具有良好的泛化能力。