BriefGPT.xyz
Ask
alpha
关键词
end-to-end speech synthesis
搜索结果 - 3
使用最先进的神经说话人嵌入进行零样本多说话人文本转语音
研究了使用多说话人建模中的神经发音人嵌入对零样本适应的影响,发现使用可学习字典编码的说话人嵌入,能够在说话人验证任务中提高等误差率,在未知说话人使用时提高零样本适应性,并提高端到端语音合成的说话人相似性和自然度。
PDF
5 years ago
DurIAN: 基于时长信息的注意力多模态合成网络
本文提出了一种通用、强大的多模态合成系统,可以同时生成自然语音和面部表情,并能改善现有的端到端语音合成系统中的词跳过 / 重复错误,同时可以对语音和面部表情的表现力进行细粒度控制。
PDF
5 years ago
JSUT 语料库:面向端到端语音合成的免费大规模日语语音语料库
本文介绍了一个名为 JSUT 的日语语音语料库,用于实现端到端语音合成,由机器学习及深度学习等技术所建立。该语料库包含 10 小时的读取样式语音数据及其转录,涵盖了日常使用日语字符的全部主要发音。
PDF
7 years ago
Prev
Next