BriefGPT.xyz
大模型
Ask
alpha
关键词
tacotron 2
搜索结果 - 3
一个模型,多种语言:元学习应用于多语言文本朗读
本文介绍一种多语言语音合成方法,该方法使用上下文参数生成的元学习概念,使用更少的训练数据和更多的语言产生自然音质的多语言语音;其模型使用 Tacotron 2 和完全卷积输入文本编码器,在训练中使用 CSS10 数据集和新的基于 5 种语言
→
PDF
4 years ago
从说话人验证到多说话人语音合成的迁移学习
描述了一个基于神经网络的文本转语音(TTS)合成系统,可以以许多不同讲话者的声音生成语音音频,该系统由三个独立训练的部分组成,包括训练说话者编码器网络进行讲话者验证任务,基于 Tacotron 2 的序列合成网络,以及将梅尔频谱图转换为时间
→
PDF
6 years ago
通过在 Mel 频谱预测上调节 WaveNet,进行自然语音合成
该论文阐述了 Tacotron 2 的神经网络框架,该框架可以从文本中直接合成语音,其系统由一种递归的序列到序列的特征预测网络和一个修改的 WaveNet 模型组成,能够实现与专业录制的语音相当的平均意见分数 (MOS)。
PDF
7 years ago
Prev
Next