Dec, 2023

PerMod: 以感知为基础的语音修改与潜在扩散模型

TL;DR通过使用 PerMod,一个基于条件隐特征扩散模型的系统,我们可以根据给定的特征向量对声音进行感知修改,以实现期望的感知特性。然而,对于不典型声音,PerMod 的性能较差。