BriefGPT.xyz
大模型
Ask
alpha
关键词
zero-shot speaker adaptation
搜索结果 - 2
StyleTTS 2:通过样式扩散和大型语音语言模型的对抗训练实现人类水平的文本朗读
本文提出了 StyleTTS2,它是一个使用了样式扩散和对抗训练技术以及大型语音语言模型的文本转语音模型,它能够有效地进行潜在扩散,实现单个和多个说话人的人类级 TTS 合成。
PDF
a year ago
使用动态卷积注意力的零样本长篇语音克隆
本文介绍了一种基于注意力机制和零样本说话人自适应技术,在语音克隆技术中可以从几秒钟的参考语音中复制目标语音,从而实现长话语的普遍化,并且可以保持较高的自然度和相似性。
PDF
2 years ago
Prev
Next