BriefGPT.xyz
Ask
alpha
关键词
neural codec language model
搜索结果 - 4
TacoLM:具有门控注意力的编解码语言模型是高效的零 - shot 文本转语音合成器
通过引入 TacoLM,一种新型神经编解码语言模型,改进了训练和推理效率,降低模型规模,并通过在每个解码器层引入额外的门控交叉注意力层,提高合成语音的效率和内容准确性。在 Librispeech 资料库的评估中,TacoLM 比 VALL-
→
PDF
14 days ago
通向通用文本指导的语音转换
这篇论文介绍了一种新颖的语音转换(VC)模型,它由文本指令引导,比如 “以慢速和低沉的音调清晰地说话” 或 “以开朗少年的声音说话”。与传统方法依赖于参考话语来确定转换语音的属性不同,我们的模型为语音转换增加了多样性和特定性。提出的 VC
→
PDF
9 months ago
SC VALL-E:风格可控的零样本文本到语音合成器
本研究提出了基于神经编解码语言模型(VALL-E)的风格控制(SC)VALL-E 模型,用以生成具有可控属性的表达性语音,并通过与其他模型的比较实验评估其性能。
PDF
a year ago
神经编解码语言模型是零样本文本到语音合成器
本文介绍了一种基于语言模型的文本到语音合成方法,使用名为 Vall-E 的神经编解码器语言模型,通过在预训练阶段将 60K 小时的英语语音数据进行规模扩大,可以使用仅三秒的不同说话人的注册录音作为语音提示来合成高质量的个性化语音,并能够在保
→
PDF
2 years ago
Prev
Next