BriefGPT.xyz
Ask
alpha
关键词
multi-speaker speech synthesis
搜索结果 - 4
ICML
A$^3$T: 面向语音合成和编辑的韵律感知声学和文本预训练
该研究提出了一种名为 A³T 的框架,通过将文本输入与声学 - 文本对齐结合,训练出预训练模型来生成高质量的重构语谱图,以实现有声编辑和无外部说话人验证模型的多说话人语音合成。
PDF
2 years ago
AAAI
Few Shot 自适应归一化驱动的多说话人语音合成
本文提出了一种新颖的少样本多说话者语音合成方法,它结合了自适应规范化架构和非自回归多头注意力模型。在性能测试中,该方法表现出了很高的效能。
PDF
4 years ago
使用非平行训练数据从语音合成到语音转换的迁移学习
本文提出了一种基于 TTS-VC 转移学习的语音转换框架,采用多说话人语音合成系统和编码器 - 解码器架构等技术,实现任意语音转换且在语音质量、自然度和说话人相似度等方面均优于竞争方法。
PDF
4 years ago
NIPS
Deep Voice 2: 多说话人神经文本转语音
介绍了一种使用低维度可训练说话人嵌入的神经文本转语音技术,可以从单个模型生成不同的声音,并构建了具有高性能的构建组件:Deep Voice2 和后处理神经语音合成器的 Tacotron,通过两个多说话人 TTS 数据集演示了多说话人语音合成
→
PDF
7 years ago
Prev
Next