BriefGPT.xyz
Ask
alpha
关键词
target speaker
搜索结果 - 2
音素幻像器:通过集合扩展的单次语音转换
提出了一种新颖的方法 “音素幻觉生成器”,它可以在仅有目标说话者短音频数据的情况下,生成多样且高保真度的目标音素,从而在语音转换中实现高逼真度和说话者相似度的平衡。
PDF
a year ago
零样本语音调制用于去噪扩散 TTS 模型
本文提出了一种新的方法,通过采样识别新目标的自然语音数据,并在推理期间利用加噪扩散语音模型生成具有目标讲话者相似声音的音频,而不需要进行任何训练步骤。
PDF
2 years ago
Prev
Next