Mar, 2023

音频扩散模型:关于生成 AI 中的文本转语音和语音增强的综述

TL;DR本文对音频扩散模型进行了调查,针对文本转语音和语音增强这两个活跃任务,它将方法分为三类,即声学模型、波导合成和端到端框架,并通过添加或去除特定信号将各种语音增强任务进行分类,最后进行实验结果比较和讨论。