BriefGPT.xyz
Ask
alpha
关键词
vall-e
搜索结果 - 2
TacoLM:具有门控注意力的编解码语言模型是高效的零 - shot 文本转语音合成器
通过引入 TacoLM,一种新型神经编解码语言模型,改进了训练和推理效率,降低模型规模,并通过在每个解码器层引入额外的门控交叉注意力层,提高合成语音的效率和内容准确性。在 Librispeech 资料库的评估中,TacoLM 比 VALL-
→
PDF
14 days ago
神经编解码语言模型是零样本文本到语音合成器
本文介绍了一种基于语言模型的文本到语音合成方法,使用名为 Vall-E 的神经编解码器语言模型,通过在预训练阶段将 60K 小时的英语语音数据进行规模扩大,可以使用仅三秒的不同说话人的注册录音作为语音提示来合成高质量的个性化语音,并能够在保
→
PDF
2 years ago
Prev
Next